高性能计算

当前位置: 首页 - 平台动态 - 正文

高性能计算

中南大学携手浪潮,共建高校智算平台

更新时间:2020-09-03 点击:

 

中南大学携手浪潮,共建高校智算平台

自计算机诞生之日起,科学和工程对计算性能的无限追求,一直在不断冲击和超越摩尔定律的想象。高性能计算资源的多少以及计算能力的强弱已经成为衡量高校科学技术研究水平、产品研发实力、人才培养质量和持续创新能力的重要标志。中南大学是教育部直属全国重点大学、国家“211工程首批重点建设高校、国家“985工程部省重点共建高水平大学和国家“2011计划首批牵头高校,20179月入选世界一流大学A类建设高校,学校对高性能计算资源具有迫切的现实需求。

中南大学与浪潮强强联手,共同打造国内高校计算能力一流的高性能智算平台。作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,中南大学高性能计算公共服务平台不仅可以为学校的科学研究和工程计算提供优质的服务,而且还是人才培养的重要基地,更是参与国内外高性能计算领域学术交流和科研合作的重要平台。

针对用户需求和项目特点,浪潮提出高密度AI微模块数据中心解决方案,全面运用多项业内高、新技术,为高性能设施搭建了一间高度智能化的高标准机房。整个平台拥有1058个计算节点,合计50896个计算核心,采用国际领先的DDN商业版Lustre并行文件系统和DDN统一集中式存储架构,可用存储容量超过2PB,最大持续读写带宽达到20GB/s,配置100Gb高速IB计算网络。CPU理论计算能力为4856万亿次,GPU理论计算能力为788万亿次,整个计算集群聚合计算能力达到五千六百万亿次。

60KW高冷量空调,突破制冷瓶颈

浪潮工程师在详细的实地勘察中南大学高性能计算公共服务平台建设场地的基础上,为了最大化提升空间利用率,采用业内技术领先60KW高冷量列间空调,相比传统风冷列间空调节省了7个标准IT机柜,有效提升了计算节点机柜的布置空间,计算资源相应地提升约1.2倍。60KW冷量空调优势在于,一是冷量更高,约为传统列间空调制冷量的1.5倍;二是能耗更低,使智算平台PUE值整体降低约10%

定制化布线系统,凸显美观高效

中南大学高性能计算公共服务平台采用了两套浪潮AI微模块。由于开展高性能计算应用时,存在多个计算节点需要同时协同工作的应用场景,要求两个微模块之间实现高速互联。传统的走线方式需要铺设大量的IBInfiniBand)线缆,增加了数据传输的延时,同时,IB线缆造价昂贵,经费投入巨大。为满足应用的整体化需求,浪潮在两个微模块之间采用定制化过线桥架,优化了IT机柜之间的布线,保证了系统整体协调、美观,相对传统布线方案减少IB线缆长度约20%,在有效节约投入的同时,保证了高性能计算应用对高速计算网络带宽的需求。

 

系统自动投影,运行状态一目了然

作为国内高校计算能力一流的智算平台,中南大学高性能计算公共服务平台不仅代表强大的计算能力,还是对外展示风采、传承中南文化的窗口。AI微模块搭载监控系统自动投影技术,在滑动门上通过定制化屏幕呈现出清晰的投影效果,如影相随,使观众仿佛置身于中南大学智算平台之中,通过在屏幕上投射的动态影像,可以全方位感受到智算平台所带来的强烈震撼,一睹高性能计算公共服务平台的风采,彰显中南大学的文化魅力,享受一场视觉上的盛宴。

 

AI智能监控系统,智算平台的晴雨表

中南大学高性能计算公共服务平台有了可靠的硬件支撑还需要一个大脑对其进行监控和管理。微模块监控系统采用32寸触控大屏,可运行3D可视化管理系统。3D可视化管理系统全面运用H5技术,具备监视面板、温度云图、资产查询、空间查询、功率查询、AI智能巡检等功能,有效降低了专业运维人员的工作强度。在操作间还部署了机房运维监控大屏,通过监控大屏和辅助显示器对主机房和配电、UPS设施的运行状态进行实时监控和显示。AI智能监控系统就像晴雨表,不仅可以实现数据的监控,还可以通过日志数据的统计分析,预测可能发生的故障,极大地提高了平台运行的稳定性。

 

 

结语

中南大学高性能计算公共服务平台的建设与学校智慧中南的理念不谋而合。高密度部署、定制化设计以及AI智能监控系统三大法宝为平台的稳定、持续和可靠运行提供了强有力的保障。平台将于20209月底建成并于10月份投入试运行,我们相信,平台的投入使用,必将极大地推动中南大学科学研究水平的提升,进一步促进科研成果的产出和拔尖创新人才的培养,为学校的双一流建设做出贡献。