“TOP500上第十的排名,对曙光而言,可以说是有意义,也可以说是没意义”,尽管拿到了超级计算机TOP500排名第十的位置,但历军并没有表现出太多的喜悦,对他而言,此刻的心情,是一种在完成了自己既定目标后的释然。历军也一如继往地保持着一颗平常心。“几年前也许还有将排名进一步上提的想法,但现在我们看得很淡了,我们在测试过程里有那么一个原则,就像奥运比赛一样,得第无所谓,关键是要发挥自己的水平。”
实际上,对最近几年的TOP500排行榜而言,其已被誉为衡量国际高性能计算机应用状况的“晴雨表”。而正是这些TOP选秀点燃了中国高性能计算机市场的导火线,无论是高性能计算市场的封疆大吏,还是高性能计算的王侯新贵,都在这榜单上展开了竞争。
   
曙光的排名第十
“我个人认为如果还时间,有可能将系统的效率发挥到80%”,就象是奥运会参赛,尽管表现出的是对排名的不太在意,但能感觉到的是,为了拿到第十的位置,曙光此次还是颇费了一番周折。历军同时透露了一些鲜为人知的故事:曙光在排行一个半月时间里最初测出来系统性能发挥仅为65%,后来在规则允许的情况下不断在硬件、软件上进行优化,每一次的数据都有5%左右的提高。包括系统的配制、一些驱动程序的测试算例,都是有一些优化的余地,最后的结果是180.6万亿次,5000A发挥了78%左右的效率。而到后面也几乎没时间了,如果再有一礼拜,有可能达到到190万亿次。
对WCCS 2003表现很吃惊
“打死我也没想到WCCS可以测到这样的效率”,对于此次在TOP500排名测试中WCCS在5000A上的表现,历军显得相当吃惊,“一开始的时候,我们计划的是测测看就行了,测的好可以发布,因为当时大家都认为用WCCS测是不好的,但其结果却让我们大吃一惊,78%效率的表现也让我们开始重新审视WCCS。”
对于具体的操作系统,历军坦然,不是选择哪款的问题,而是具体优化的问题,就连曙光自己也不能断定跑出来之后到最终再优化哪一个更好,但他同时也认为,即使表现再好也就是两个百分点左右了,不可能再高了。“两个百分点已经不重要了,如果大家都去追求这两个百分点,那就变成竞赛了,单纯为了排名从应用的角度来看没什么意义了。”
至于此次测试为什么选用Windows的WCCS,历军表示,目的是为了把高性能计算机应用的复杂度有所降低。用户现在面临一次信息技术和其他的相关的科学结合的变革,也就是未来很多用户真正高水平用户不是来自于计算机行业,而是搞核研究、搞基因的,对他们来说,要想学成Linux的高手,相对还是不那么容易。所以曙光这次用Windows的测试,实际上我们也是实验一下,其实我们Windows和Linux全部都测过,只不过最后我们最后感觉Windows在部署还比较方便,这也是它的优点。
“这是非常重要的一点,这也证明了曙光5000A可以良好的支持Windows的操作系统,给我们用户一个选择,当然我个人认为目前在这种超大规模的应用领域,包括在软件、应用软件方面可能还有一些很多的工作要做,可能还有一个路程。但是至少我认为,在中小规模的HPC上,类似个人HPC上,Windows也是一种选择。”
下一代高性能将大量采用GPU
“千万亿次需要全新的体系架构”,在完成了百万亿次的产品研发后,千万亿次已经成为了历军的下一步目标。“在我看来,目前曙光5000A的基本结构,在cluster上已经走到了头。未来的高性能计算机有几个发展趋势:一是通用和专用产品相结合的方式,第二是专用处理器大规模应用,第三针对专门的问题或者应用软件去设计机器,使这个机器更容易的改变形态,适合某一类应用。”
回顾过去的发展,历军认为,高性能计算机的技术发展史是由专用机到通用机,再由通用机到专用机的发展,但完全的专用机可能不太会出现,大家会在通用机的基础平台上去提高专门的领域里的计算性能获得超高性能。所以曙光5000A通用系统逐步的会再往专用的方向迈一步,比如协处理器——GPU有可能是下一代高性能计算机中大量采用的技术,这代表了一种方向。
实际上,在成功研发出了5000A以后,6000产品已经自然而然地进入了曙光的下一个工作重点,据历军透露,曙光内部代号曙光6000应该是第三种设计方式。当然,围绕曙光6000产品应该还有一系列的研究开发的任务,其中也包括高性能处理器、高性能交换芯片、更高的密度、更好的散热的机械结构的设计,包括专门的应用软件的移植优化,曙光也将会投入更多的力量,毕竟应用软件是限制高性能计算发展的重要瓶颈。
历军表示,曙光的下一个阶段规划是分两条腿走,一条是做硬件,二是根据机器帮助客户搞应用。因为下一代的高性能计算机可能不像现在已经完全通用了,里面有很多部件一般用户是不会用的。所以曙光将硬件软件两个方面去做。
高性能的市场化之路
2008年,对曙光而言,除了5000A的发布,另一个重点的看点也就是PHPC100,也就是面向个人的高性能计算机产品。
“下一步,曙光会发布基于曙光HPP架构的不同种类的产品,这些产品将面向石油勘探、数字媒体、化学、基因等不同领域,他们的规模没有5000A大,可能是10万亿次,也可能是50万亿次。”
 历军介绍说,今年9月份,曙光推出了个人高性能计算机——曙光PHPC100。“两个月以来,曙光在全国进行了第一波市场推广,结果证明效果非常好,有大量的用户需要这个产品,它不但小巧,而且性价比非常高。”
 “目前,高性能计算在中国还没有走向普及,而曙光的PHPC将推动这一大潮。过去用小型机的客户,万全可以从曙光的PHPC体验到高性能计算机带来的新感受。从发布到现在的两个月时间,已经有好几十台产品销售出去了。”
 在历军的规划下,从个人HPC到面向各种专业应用的专用机再到曙光5000A通用机,曙光已经形成了从低到高的一个完整的高性能计算机产品线系列。
高性能是硬件带动应用发展
“对于高性能计算机的生产厂商而言,我们需要知道我们的用户关心什么,在这个排名背后更真实的内容,如高性能产品的系统能力、稳定性及产品的商业化工艺水平等等”,历军表示,质疑的声音从未停止过,比如中国是否需要千万亿次计算机等等,是不是又是劳民伤财的形象工程?
“实践证明从先进国家的角度看,中国的高性能计算机不是多了,而是少了。为什么?因为TOP500的前十名里有九台都在美国,都比曙光的强。”对于业界的质疑,历军谈出了自己的观点。
他认为,美国的高性能计算机需求和中国其实是一样的,比如能源、军事、航空航天、材料、飞行器等等,中国与其的差距仅仅是在应用水平上,但高性能计算机从来不是应用带动机器发展,而一直都是机器带动应用发展。这就象是首先需要盖一个鸟巢然后才能开奥运会的道理一样,因为需要有一个舞台。
“数学家如果碰到硬件的瓶颈自然就挡在这里了,没有办法去做自己的研究,所以一定是机器走先。当然也不能走的太远,和应用有一代的差距我觉得是完全可以的”,历军谈到这里时举了曙光4000A作为例子,比如4000A,现在已经成功地应用于神六、神七、包括大飞机设计,所以机器带动应用这是一个现阶段必须走的一个必经之路。“我认为国内仍然需要先有一个平台放在那里,科学家才能在这个平台上逐步的把方法、模型做好,这是一个基础。”
但这并不意味着曙光要去做商业软件,历军认为,曙光需要做的是这些科学家所做不了的事,比如有一个算法,这个算法怎么在计算机里获得更高的计算效率,这是曙光可以做的。如何从过去软件的靠程序迭代的方式做的模型,如何用硬件在逻辑门实现计算,而不是像以前都是C语言的程序,这样效率太低。
“这是曙光能做的,在一些已经成型的软件或者模型里,曙光来帮助他们优化,让高性能计算机的计算效率能够更高。”
采访后记:历军谈话中透露出中国人、中国企业特有的底气,“在市场上,曙光5000A应该说可以代表着中国高性能计算机研制的最高水平,而且从国际上看,似乎也不落后。从本届TOP500前十名排名来看,除了曙光一家中国公司,其他全是美国公司。美国这方面投入需求似乎比我们要强,但是从他们的产品看,我们似乎没在结构上、技术上输给他们很多,就是有那种数量级的差,我们跟他们已经很接近了,下一代机器有可能跟他们没有区别了,甚至某些点上有一些超越。”