新闻中心

EEPW首页 > 智能计算 > 市场分析 > 中国工程院院士、清华大学计算机系教授郑纬民:重视我国超算基础软件生态建设

中国工程院院士、清华大学计算机系教授郑纬民:重视我国超算基础软件生态建设

作者:时间:2023-08-25来源:收藏

今日,在 2023CCF 全国高性能计算学术年会(CCF HPC CHINA 2023)中,中国工程院院士、清华大学计算机系教授郑纬民做了题为《重视我国超算基础软件生态建设》的主题演讲。

本文引用地址:http://www.amcfsurvey.com/article/202308/449936.htm

会议伊始,郑纬民教授提到了中国超算的情况:国产超算处于国际第一梯队!国产超算是中国的一张名片!国产超算是信创的典范!

中国超算为何能跻身国际前列呢?首先,中国能做最快的计算机。过去十年,中国在顶尖超算系统研制处于国际领先行列,下图为中国超级计算系统部署情况。

其次,TOP 500 的机器里,中国占有量基本是第一。比如 2022 年,500 台里中国有 162 台,占比 32.4%,位居世界第一。

第三,中国超算的应用也取得了很好的成果。以入围 ACM Gordon Bell Prize 为例:2014 年中国超算就已经应用在地震模拟当中,2016 年应用在大气动力框架、相场模拟、海浪模拟,2017 年应用在地震模拟和大气模拟,2018 年应用在图计算框架,2021 年应用在量子模拟、人造太阳和第一性原理等领域。

此外,中国超算还多次获得了国际超算最高奖 ACM Gorden Bell 奖。2016 年 ACM 戈登贝尔奖千万核可扩展全球大气动力学全隐式模拟。2017 年 ACM 戈登贝尔奖非线性大地震模拟。2021 年 ACM 戈登贝尔奖基于最优收缩路径的通用量子模拟器。

可见,中国超算已经取得了不错的成绩,不过郑纬民教授提出,中国超算在软件生态建设上还存在几点问题。

问题一:将领先算力高效转化为解决科学与工程难题能力依然存在重大挑战

将世界领先的计算能力高效转化为解决尖端科学与工程难题的能力是世界范围难题,且随着异构架构路线的发展更加剧了该问题的鸿沟。关于应对方案,郑纬民教授表示,超算基础软件是提升转化能力的关键之一。

超算基础软件是实现并行应用开发、优化、部署、运行高效的基础和关键。国产超算系统已经部署部分基础软件,仍有亟待解决的问题。

问二:架构多样,应用移植和调优工作量大

目前的情况是:不同选择各异架构实现算力跨域发展,加剧了应用在移植和优化上面临的困难;不同系统需要单独编程与优化;相同的应用需要在不同平台单独编程和优化;编程复杂度高;异构架构在负载均衡、同步上需特殊考虑;不同编程语言和接口;程序很难简单移植。此外,国产超算平台的移植成本高昂。

对此,郑纬民教授提出了针对这一问题的建议:加强跨平台编译优化平台的研究和建设、统一并行编程模型和编译优化平台。一次编程,跨平台高效运行。

问题三:国产超算平台支持复杂应用全流程计算的能力亟须改善

郑纬民教授提到大计算往往与大数据相伴,不过国产超算平台软件支持并不完备,无法实现全流程大数据处理与人工智能应用的快速移植和部署。此外 I/O 能力也存在不足——比如在由国家并行计算机工程技术研究中心研制的超级计算机神威·太湖之光上,分钟级计算完成,却需要 40 分钟预处理和载入数据。郑纬民教授的建议是加强国产超算 HPDA 系统软件的建设。

问题四:跨超算中心协同研发和部署战略应用的能力亟需提升——算力网络

针对这一问题,郑纬民教授提到要建立跨超算中心协同的战略应用快速研发支持。高性能专项已支持「国家高性能计算环境领域应用平台及服务体系研究与构建」等项目设计和实施跨中心协同开展领域应用的方案。

建立起更广泛安全的计算与数据互连,开展相关基础软件创新,超级计算创新联盟也许可以发挥更大作用。那如何实现这一艰巨任务呢?郑纬民教授认为在这之前要先解决两件事情,第一点就是算力互联。算力互联要求带宽高、延迟低。

第二个要解决的是网络传输问题。以气象领域为例,气象领域每分钟可产生 90GB 数据,一天 124TB 的数据,如何将这些数据传输到超算中心?两种解决方案:高速网络连接和随身携带。

高性能网络的优点是体验好,足不出户就可以完成数据传输业务;缺点是包年租用价格太贵,100Gbps 专线列表价 266 万-322 万/年(含 IP)。随身携带的优势是按需传送,在可携带范围内吞吐量相对较高;缺点是体验差,需要人员携带存储设备乘坐交通工具送达,存在多次拷贝的问题。

不过太湖之光数据快递业务试点技术方案(端到端弹性网络)已经可以带来不错的体验。通过测算,采用 3 条 PON 弹性云专线聚合和云互连传输 4T 数据需 3.03 小时,初步测算单次传输价格低于 1000 元,比现有云专网包月、云专网弹性均具备价格优势,而且提供更好的体验。

最后,郑纬民教授表示中国超算已经做出了很大的成绩,未来再把生态做好,中国超算也一定会有更好的发展!



关键词: 国产超算平台

评论


技术专区

关闭