针对神威系列超算的架构特性,团队设计了一种多层次混合并行方案,深入优化了主核处理单元(MPE)和众核处理单元(CPE)之间的数据交换以及计算内核的执行顺序和相互融合。由于FR方法的数据局部性较好,高阶FR格式的矩阵计算强度高,矩阵运算最高可占计算时间的60%。对于16.9亿网格单元和8650亿自由度(DoF)的高压涡轮算例,求解器实现了115.8 DP-PFLOPs的持续计算性能。
随着超大规模异构计算的发展和数值技术的进步,他们证明了利用大涡模拟来解决航空发动机复杂流动的可行性。该工作为实现美国国家航空航天局NASA提出的航空发动机整机数值模拟迈出了坚实的一步。
图3 神威太湖之光超级计算机
“戈登·贝尔”奖被誉为国际高性能计算应用领域的“诺贝尔奖”,由ACM(Association for Computing Machinery)每年评选和颁发,授予在世界领先的超级计算机上使用最先进的软件和硬件技术进行的最有价值的科学计算。
今年,“戈登·贝尔奖”评奖委员会从众多参赛团队中选出了六个团队入围,课题涉及多个科研领域,包括材料科学、流体动力学、核模拟、地震处理和生物分子模拟。入围团队使用的硬件平台也包括世界一流的超级计算机系统:Frontier(ORNL,美国)、新一代神威系统(中国)、LUMI(EuroHPC/CSC,芬兰)、Leonardo(EuroHPC/Cineca,意大利)、Cerebras CS-2(KAUST,沙特阿拉伯)和Perlmutter(NERSC,美国)。
2023年8月26日,在2023年CCF全国高性能计算学术年会(CCF HPC China 2023)上,该项目研究成果荣获“2023年度中国超算最佳应用”奖。
该成果的支撑论文见:https://arxiv.org/abs/2308.06605