超级计算机:从零开始赢得速度和应用“双重优势”

  • 2021-06-30 11:38
  • 科技日报

未来,中国科研团队将继续以提高国家科技创新能力为重点,以“神威太湖之光”超级计算机为基础,进一步解决气候、环境、生命、材料、制造等领域的重大科学问题,研究高性能计算核心技术,提升高性能计算应用水平,培养高性能计算人才。

杨广文

国家超级计算无锡中心主任

高性能超级计算机是世界发达国家正在努力争取的重要“制高点”,对国家安全、经济和社会发展起着重要的支撑作用。因此,加快超级计算机的发展,推广超级计算机的应用,对于我国的科学研究,促进科技创新,促进经济社会高质量发展具有重要意义。

40年来,中国的超级计算机经历了一个从无到有,从跟风到本地领先,从引进关键核心技术到实现自控的艰难发展过程。

勇于突破封锁,我国超算技术不再受制于人

“多年来,中国与美国、日本等国在超级计算机领域的竞争,实际上是科技实力与综合国力的竞争。”中国科学院计算技术研究所研究员张云泉说,中国几代超级计算机创造了巨大的“奇迹”。截至目前,天河二号、神威太湖光等国产超级计算机已在国际超级计算机竞赛中获得10项世界第一。

在无锡国家超级计算中心主任杨广文的记忆中,20世纪70年代第一台超级计算机问世后,国际上对超级计算机的需求激增。发达国家利用超级计算机在关键行业取得了许多突破。当时美国、日本等国在一些关键核心技术上完全封杀了中国。

当时,由于我国缺乏高性能的计算机,石油储量的一些数据和资料不得不通过飞机送到国外进行处理,不仅费用昂贵,而且还要受制于人。

当时中国向一个发达国家提出进口一台性能低下的超级计算机,对方回答:这台机器需要建立一个六面不透明的“安全区”,只有巴黎统筹组织的工作人员才能进入“安全区”。

1978年,中共十一届三中全会召开,拉开了改革开放的序幕。也就是在今年,中国正式开始了超级计算机的开发。

“你为什么要开发自己的超级计算机?因为中国要搞四个现代化,离不开超级计算机!”杨广文告诉《科技日报》记者,超级计算机由大量计算节点组成,每个节点由一些CPU(中央处理器)组成,计算节点通过高速互联网连接。此外,整个系统还包括大型存储系统、系统软件、应用软件和冷却系统。所以,短时间内,中国要在超级计算机核心技术上取得重大突破,在世界上跑在前面,并不容易。

然而,我们的研究人员并没有被目前的困难吓倒。当时他们脑子里只有一个想法:尽快建成中国自己的超级计算机,不再在技术上受制于人。

从1978年到1983年的五年间,承担这项任务的R&D团队夜以继日地辛勤工作,解决了基础理论、技术和制造工艺上的无数难题,克服了数百个关键技术难题,创造性地提出了“双向阵列”结构并完成了总体设计,比原计划提前一年成功研制出“银河一号”超级计算机。

1983年12月26日,我国第一台十亿次超级计算机“银河一号”正式通过国家技术鉴定,系统达到并超过预定的性能指标。整机稳定可靠,成本仅为原方案的1/5。

这表明中国已经成为世界上少数几个能够自主设计和开发数十亿台超级计算机的国家之一。

面向国家需求,实现真正安全自主可控

“自2002年以来,经过15年的快速发展,中国的超级计算机已经实现了安全性、自主性和可控性。”杨广文说。

在过去的10年里,中国考虑到基于自主可控超级计算机系统的软件和应用,重新安排了超级计算机的研发,为国家的特殊需要和高科技产业的发展服务。

“十三五”国家重点R&D规划设立了“高性能计算”重点项目,为高性能计算机、系统软件和应用的发展提供布局支持。其中,“神威太湖之光”的研制是国家重点组织开展的重大科研课题。

2013年4月22日,江苏省人民政府正式提出在无锡建设10亿的超级计算中心,得到科技部支持;2014年3月5日,科技部同意建立“高性能计算机及应用服务环境(二期)”重大项目;2015年12月31日,“神威太湖之光”超级计算机研制成功。

用相关专家的话说,随着“神威太湖之光”超级计算机、“神威26010”处理器等标志性成果的出现,打破了国内超级计算机平台没有“核心”可用的长期局面,奠定了国内平台安全、独立、可控的技术基础。

记者了解到,“神威太湖之光”超级计算机由40个计算机柜和8个网络机柜组成。每个计算机柜包含4个超级节点,由32个计算插件组成,每个插件由4个计算节点板组成,一个计算节点板包含2个“神威26010”高性能处理器。

“一柜1024个处理器,‘神威太湖之光’有40960个处理器。”杨广文说。

值得一提的是,“太湖神威之光”也是中国第一台完全用国产处理器建造的超级计算机。截至目前,已连续四次获得全球超级计算机大赛冠军,浮点运算速度达到每秒9.3亿次。其中,2016年11月,“神威太湖之光”以巨大的计算速度优势再次获得世界超级计算机冠军,基于该超级计算机的高性能计算应用项目获得国际高性能计算应用领域最高奖。“戈登贝尔”奖已成为中国高性能计算应用的发展一个里程碑式的成就。

“让基于自主可控超级计算机系统的软件与应用登上国际巅峰,做强国产软件,这是我们超算人的追求与梦想。”国家超级计算无锡中心研发中心主任甘霖说。

比拼应用水平,让大机器发挥出大作用

“超级计算机为解决工程和科学中的重大难题而生。”国家超级计算无锡中心副主任付昊桓说,衡量超级计算机的价值,不能只看运算速度,还要看应用水平。

“比拼谁的超级计算机‘跑’得更快,这种竞赛曾一度在中、美、日、韩等国之间进行。不过,现在大家比的是,超级计算机能被用在什么领域,这成为如今竞争的关键点。”杨广文说。

那么,该如何让大机器发挥出大威力?

在杨广文看来,国家超级计算无锡中心主要的职责就是运维,运维的目的就是用好这台超级计算机。

近7年来,国家超级计算无锡中心的科研团队不负众望,将理论与实践相结合,通过开展跨学科、跨单位的广泛交叉合作,使基于“神威·太湖之光”系统的并行应用成果频出。其中,利用“神威·太湖之光”超级计算机每秒10亿亿次的超强计算力,研发出的有关气候模拟、地震模拟、工业仿真、生物医药等领域的一系列国产应用软件,助力我国基础研究和工程创新,展示了国产超级计算机硬件与软件相结合的巨大潜力。

2017年11月17日,在美国丹佛举行的全球超级计算大会上,由中国科研团队完成的“非线性地震模拟”再获“戈登贝尔”奖。利用“神威·太湖之光”的强大计算能力,该团队成功地设计实现了高可扩展性的非线性地震模拟工具。该工具首次实现了对唐山大地震发生过程的高分辨率精确模拟,使得科学家可以更好地理解唐山大地震所造成的影响,并对未来地震预防预测等具有重要的借鉴意义。

此外,杨广文表示,超级计算机还能为人工智能领域的深度学习服务。“现在,许多IT公司的技术负责人找到我们,主要因为我们开发了大量基于深度学习算法的并行软件,研发了一个深度学习平台swCaffe。目前,我们已开展的、基于超级计算机的深度学习应用,包括围棋、语音识别、医学图像识别、遥感图像分类、地震波余震特征识别、大规模冷冻电镜生物大分子模型高精度重构等。”杨广文说。

杨广文告诉记者,目前国家超级计算无锡中心“神威·太湖之光”系统运行稳定,用户数量不断增加,机器利用率已超过50%,已完成200多项百万核大型问题的求解任务,涉及航空航天、先进制造、生物医药、新材料、新能源等重点领域,有效地支持了国家科学研究与产业创新。

这些重要的应用成果在国内外引起了巨大反响,这证明“神威·太湖之光”能够支持具有战略需求的挑战性应用,并向世界展示了中国超级计算机的国际地位和重要影响力。

值得一提的是,近年来,国家超级计算无锡中心高度重视人才引进与培育。目前,该中心拥有国内外特聘专家30余人,专业涉及计算机软硬件开发、气象气候、生物基因、海洋物理、力学、大数据、云计算等。此外,该中心每年还承担清华大学在读博士生、硕士生的培养任务。

杨广文表示,未来我国科研团队将继续围绕提升国家科技创新能力,以“神威·太湖之光”超级计算机为基础, 进一步解决气候、环境、生命、材料和制造等领域的重大科学问题,研究高性能计算的核心技术、提升高性能计算的应用水平、培养高性能计算人才,为我国基础研究及产业发展提供强有力的支撑。

头条推荐
图文推荐