HPL(高度并行计算基准测试)

HPCG(高性能共轭梯度性能测试)

IO-500(I/O性能测试)

4个科学计算应用包括:

CESM(通用地球模式系统)

GROMACS(分子动力学模拟)

论文复现(Memory-Centric X-ray CT Reconstruction with Massive Parallelization ,以存储为中心的并行化 CT 重建算法)

现场公布的神秘应用(miniVite,并行化图社区发现)

CESM(通用地球模式系统)

GROMACS(分子动力学模拟)

论文复现(Memory-Centric X-ray CT Reconstruction with Massive Parallelization ,以存储为中心的并行化 CT 重建算法)

现场公布的神秘应用(miniVite,并行化图社区发现)

知识点

超级计算(supercomputing),也称为高性能计算(high-performance computing),是研发超级计算机(supercomputer)及其软件和应用的领域。

国际大学生超级计算机竞赛(SC超算竞赛)2007年始于美国,与世界大学生超级计算机竞赛(ASC,始于2012年),国际超级计算机竞赛(ISC超算竞赛,2012年源于德国)并列为世界最具权威性的三大国际大学生超算竞赛。清华学生超算团队从2010年开始征战上述三大国际赛事,早在2015年清华超算团队取得了三大赛事的全部冠军,实现了第一次“大满贯”。

编程是让计算机为解决某个问题而使用某种程序设计语言编写程序代码,并最终得到相应结果的过程。为了使计算机能够理解人的意图,人类就必须要将需解决的问题的思路、方法、和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根据人的指令一步一步去工作,完成某种特定的任务。这种人和计算机之间交流的过程就是编程。

跑数据指编程后,为检验其是否有纰漏,代入各种情况,并将其输出结果与标准答案比对的过程。

NetCDF(network Common Data Form)网络通用数据格式是由美国大学大气研究协会(University Corporation for Atmospheric Research,UCAR)的Unidata项目科学家针对科学数据的特点开发的,是一种面向数组型并适于网络共享的数据的描述和编码标准。目前,NetCDF广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多领域。用户可以借助多种方式方便地管理和操作 NetCDF 数据集。

超级计算(supercomputing),也称为高性能计算(high-performance computing),是研发超级计算机(supercomputer)及其软件和应用的领域。

国际大学生超级计算机竞赛(SC超算竞赛)2007年始于美国,与世界大学生超级计算机竞赛(ASC,始于2012年),国际超级计算机竞赛(ISC超算竞赛,2012年源于德国)并列为世界最具权威性的三大国际大学生超算竞赛。清华学生超算团队从2010年开始征战上述三大国际赛事,早在2015年清华超算团队取得了三大赛事的全部冠军,实现了第一次“大满贯”。

编程是让计算机为解决某个问题而使用某种程序设计语言编写程序代码,并最终得到相应结果的过程。为了使计算机能够理解人的意图,人类就必须要将需解决的问题的思路、方法、和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根据人的指令一步一步去工作,完成某种特定的任务。这种人和计算机之间交流的过程就是编程。

跑数据指编程后,为检验其是否有纰漏,代入各种情况,并将其输出结果与标准答案比对的过程。

NetCDF(network Common Data Form)网络通用数据格式是由美国大学大气研究协会(University Corporation for Atmospheric Research,UCAR)的Unidata项目科学家针对科学数据的特点开发的,是一种面向数组型并适于网络共享的数据的描述和编码标准。目前,NetCDF广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多领域。用户可以借助多种方式方便地管理和操作 NetCDF 数据集。

中国在全球超算top500中表现出色但仍有进步空间

在2020年超级计算大会(SC20)上,最新公布的全球超算 TOP500 榜单、中国高性能计算机性能排行榜 TOP100 显示,日本超级计算机“富岳”(Supercomputer Fugaku)蝉联世界第一,美国的 Summit 位列第二、第三是美国的Sierra、中国的“神威·太湖之光” 位列第四、第五位也是美国的Selene。

如果以国家来看,在全球性能最强的 500 台超算中,在数量方面,中国占据了213 台,份额为42.6%,排名第一;第二名是美国,拥有113 台,份额为22.6%;第三名是日本,拥有34台,份额为6.8%;在总体性能上,前三名也分别是中国、美国和日本。

另外,根据2020 中国高性能计算机性能排行榜 TOP100显示,除了居于全球前列的“神威·太湖之光”和“天河二号”之外,来自 DELL、同方、联想的超算也进入我国超算前十,其中由联想研制的超算在前十当中共有6台。

清华大学超算团队简介

代表清华参加此次比赛的队伍是由6名来自计算机系的本科生组成,包括:张晨(计71)、陈嘉杰(计72)、王雨田(计73)、钟闰鑫(计71)、宋泽宇(计84)、翟明书(计82),指导教师为计算机系副教授翟季冬、助理研究员韩文弢和助理研究员甘霖。

学生超算团队成员克服了队伍磨合不足、远程比赛的时间差、72小时连续作战引起的疲劳、比赛规则的改变以及临场的各类技术难题等各方面困难,最终凭借综合能力、现场发挥和资源调度获得总冠军。在LINPACK、HPCG、IO500三个经典的基准测试赛题中,IO500在计算机系高性能所自主研制的MadFS支持下取得了143.73分的成绩,是第二名的5倍多,清华 以绝对优势排名第一。

队员们在接受AI科技评论的采访时表示:

比赛的各个赛题都具有挑战。LINPACK/HPCG是两个经典的基准测试程序,用以测试集群的浮点运算性能,只有使用极大的算力才能获得高分,但巨大的算力背后是极高的花费,我们在比赛中使用了144块 V100来运行这个题目,每小时的花费高达533美元,也就是一个小时就足以花去总预算的1/6,因而这两个程序对资源调配以及负责运行的队员的心理素质、突发情况处理都有极大的考验。IO500是一个比较新的基准测试程序,主要测试文件系统的IO。

我们使用了清华大学计算机系高性能计算研究所自主研制的MadFS 文件系统,取得了143.73分的成绩。

这一文件系统也被用在了鹏城实验室的超算系统上,参加了全球公开的IO500测试,获得了今年IO500 榜单的第一名。

这是清华超算团队拿下的SC三连冠,冠军的背后是一群人的努力和奉献。

团队目前有三位指导教师,其中两位老师身经百战、曾带领团队多次拿下冠军:翟季冬老师从2014年就开始指导比赛、韩文弢老师则是从2016年开始指导。

另外团队成员如张晨、陈嘉杰、王雨田、宋泽宇、翟明书都参加过同样具有很高含金量的超算比赛ISC20并取得了很好的成绩;“

团队的选拔和培养主要以兴趣为主,我们其实是一个兴趣团队。”翟季冬介绍到,“同学们在日常培训中会表现出不同的兴趣,有人对硬件感兴趣,对程序优化和程序分析方面有很大的发挥空间……我们会在比赛中极力去发掘和培养他们的这些兴趣。”

据官网介绍:清华大学计算机系从2012年组建超算团队至今,共组织参加了17次国际赛事,50多名同学参与其中。由于在高性能计算、并行系统和计算机系统等方面所具有的完整教学体系,清华大学计算机系为团队的建设给予了充分支持,同时积累了良好的梯队建设经验。指导教师翟季冬在超算领域所取得的多项科研成果,也对团队的多次夺冠有所帮助。

队长于纪平说,通过参加比赛,接触到了世界上最先进的硬件,因为比赛题目都是真实的科学计算应用,这更增进了自己的实践能力。

团队合影

超算比赛对于本科教学是很好的扩展和补充。计算机系为本科同学设置了《编译计算》《高性能计算导论》等超算领域的专业选修课程,为同学们了解超算相关理论打下基础。而通过团队集训以及比赛题目中的众多真实的科学计算程序,更好地锻炼了同学们的动手实践能力,实现理论与实践的紧密结合。

通过参加超算团队,本科毕业后更多的同学选择在超算领域继续走下去。

北京大学超算团队简介

本次比赛中,北京大学超算队由信息科学技术学院计算机系高能效计算与应用中心梁云副教授,信息科学技术学院硕士研究生付振新担任教练。

北大超算队参赛之

6名队员均来自信息科学技术学院,其中5名来自图灵班。

团队组成如下:

许朋程(队长),2017级图灵班

潘樾阳(队长),2018级图灵班

樊泽嘉,2017级图灵班

杨芳源,2017级

顾宇晨,2018级图灵班

郝哲文,2019级图灵班

许朋程(队长),2017级图灵班

潘樾阳(队长),2018级图灵班

樊泽嘉,2017级图灵班

杨芳源,2017级

顾宇晨,2018级图灵班

郝哲文,2019级图灵班

北京大学SC20参赛队员及指导老师

前排自左至右:杨芳源、顾宇晨、樊泽嘉

后排自左至右:郝哲文、许朋程、潘樾阳、梁云

赛后采访

梁云

教练,高能效计算与应用中心副教授

感谢学校和学院对超算队的支持。我从2016年超算队成立开始担任教练至今,见证了队伍的成长。通过这几年的培养,我非常高兴地看到很多同学走上了和高性能计算相关的道路,多名同学毕业后前往 Stanford, MIT, UCB, PKU 等高校继续深造;同时,越来越多的同学开始对超算感兴趣,不断有新鲜血液加入到团队中来。

许朋程

第三任队长,2017级图灵班

因为疫情,赛制和规则有了一些新的变化,对我们来说是一个挑战。同时这个比赛是团体赛,队员之间需要相互信任,但受到疫情影响,从今年3月到开学之前我们一直是线上联系,很难培养默契,尤其是对于新加入队伍的同学来说。线上训练一方面让大家的讨论效率受到了影响,另一方面也很容易缺少热情。针对这个问题,我们会制定一些任务,让同学们相互监督和鼓励,也会经常做一些小活动、小游戏去增进同学们之间的感情。

潘樾阳

第四任队长,2018级图灵班

往年的比赛是限制我们搭建的集群的功率,今年因为是线上,所以变成了限制集群的预算,因此对队伍的预算管理提出了非常大的考验。我们需要思考每个应用花多少钱,这是一件对于最后的结果非常重要的事情。同时,比赛的感觉是不可替代的,经历了比赛我们才知道应该怎样安排比赛的节奏,只有做了充分的准备才不至于在比赛中手忙脚乱。

超算队队员

2017、2018、2019级本科生

在比赛中我们和很多有着不同背景的老师、同学接触,学到了很多新的知识。对于信科的同学来说可能跑代码是自己的专长,但是代码背后的一些专业性的知识我们需要请教更多本专业的老师和同学。在这个过程中我们慢慢学着怎样与别人沟通,这种沟通既要高效地解决我们的问题,又要让对方感到舒服,对我们来说也是一种成长。

背景链接

背景链接

“图灵人才培养计划”的设立旨在打造深具北大特色的计算机类本科生和研究生培养计划,建立课程教学与科研培养的示范体系,全面提升北京大学计算机和人工智能学科的教育与人才培养水平,为国家培养计算机领域未来的领军人才。

该计划由本科生和研究生培养两部分组成。本科生培养基于北京大学信息科学技术学院于2017年创办的“图灵班”,研究生培养计划随之于2019年立项。

“图灵班”发起人之一、指导委员会主任、图灵奖得主John Hopcroft教授亲自设计培养方案及课程体系,并亲自讲授、旁听和一对一交流相关课程,确保课堂质量。

本文内容综合整理自清华北大官网及网络,仅供分享,版权归原作者所有。返回搜狐,查看更多