国防科技大学研制成功首台千万亿次超级计算机

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




        国防科学技术大学日前研制成功了我国首台千万亿次超级计算机系统“天河一号”。在中国高性能计算机TOP100组织今天在此间公布的2009年度前100强排名中,“天河一号”位居榜首。“天河一号”诞生,是我国战略高技术和大型基础科技装备研制领域取得的一项重大创新成果,实现了我国自主研制超级计算机能力从百万亿次到千万亿次的跨越,使我国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。

中国首台千万亿次超级计算机“天河一号”究竟有多“超级”?以下是一组相关数字。

数字一:全系统峰值性能为每秒1206万亿次,Linpack实测性能为每秒563.1万亿次。这意味着,“天河一号”计算一天,一台配置Intel双核CPU、主频为2.5GHz的微机需要计算160年。

数字二:共享存储总容量为1PB。按国内数字图书馆应用软件的图片格式PDG为例计算,如果平均每册书大小约10MB的话,“天河一号”的存储量相当于4个国家图书馆(藏书量为2700万册)之和,能够为全国每人储存一张大小接近1mb的照片。

数字三:“天河一号”由103台机柜组成,每个机柜占地1.44平方米、高两米、重1.5吨,系统总重量相当于19个神舟飞船。把通风等条件考虑在内,放置“天河一号”需要一个近千平方米的房间。

数字四:全系统包含6144个通用处理器(CPU)和5120个加速处理器(GPU),仅系统级软件就有20多万行代码。按照每人每个小时写20行代码的速度,需要写1万小时。

数字五:互联通信网络的单根线传输速率为10Gbps,这是目前国际上最快的速率,相当于在“天河一号”计算机内部修了一条信息高速公路。

数字六:直接参与“天河一号”研发的科技人员有200多人,平均年龄为36岁。

数字七:“天河一号”目前投资为6亿人民币。从信息技术的发展速度预计,使用寿命预计为10年。

数字八:全系统运行情况下,每小时耗电1280度。能耗比即每瓦电创造的计算效能为4.3亿次运算,与目前峰值性能排名世界第一的美国“走鹃”超级计算机相当。

(5个打分, 平均:3.80 / 5)

雁过留声

“国防科技大学研制成功首台千万亿次超级计算机”有29个回复

  1. mil 于 2009-10-31 4:53 下午

    绿色,环保。

  2. hnws 于 2009-10-31 5:55 下午

    想問一下,對於有些人評論天河四號是“这次的天河还是一个柜子加一个柜子装出来的”,您是怎麼看的?
    http://blog.sina.com.cn/s/blog_53a407dc0100foio.html
    另外一個就是我昨天看到網上流傳的數據,天河的效率是46%-47%,落後於排名前十的那些計算機的70%-80%,甚至落後於曙光5000A的近80%,您能不能說一下這個數據具體代表什麼呢?

  3. 杰夫 于 2009-10-31 8:36 下午

    对这类新闻的客观、深入报道,你不能去看《人民日报》,可惜这篇报道很像人民日报:-)。为了显示《弯曲评论》与人民日报的区别,我来说几句。

    我对这个新闻不太感兴趣,因为这种计算机的计算能力能做多高,主要看你有多少钱,有多大地方,不是什么技术难题,就是一个一个(商用)CPU往一块装。

    这个天河一号,用了6144个Intel CPU和5120个AMD GPU(有猜测是Intel Nehalem EP 和 AMD FireStream 9270)。CPU和GPU混用,这倒是一个比较新颖的设计。 有一点值得注意,“全系统峰值性能为每秒1206万亿次,Linpack实测性能为每秒563.1万亿次”,也就是说其实测效率甚至低于50%,远低于国外同类计算机的75%左右,日本的“Earth Simulator”甚至达到了93%。

    其中原因,可能有设计的问题,但估计主要是因为使用了GPU。目前的GPU的on-chip cache较小,经常需要访问内存,所以限制了其最高计算性能。

    投资数亿元做这个机器,主要还是要看能不能真正用起来。从国防科大以前“银河”的经验来看,前景不容乐观。不过,可能不会影响“天河二”, “天河三”的不断推出。

  4. jeffchen 于 2009-11-01 2:29 上午

    评论很专业

  5. 阿斯顿 于 2009-11-01 3:36 上午

    想看专业人士的分析,在弯曲看到了

  6. gavin 于 2009-11-01 5:10 下午

    功耗能达到“走鹃”的水平,还是很高

  7. Wood 于 2009-11-02 7:36 上午

    “仅系统级软件就有20多万行代码。” 。这个值得拿出来吹吗?Linux现在内核源码早已超过1000万行了。:)

  8. 删吧 于 2009-11-02 10:22 上午

    呵呵,一看就是瞎吹。 我去年一个人就写了10万行的代码 。

  9. 删吧 于 2009-11-02 10:23 上午

    组里的一个小伙,写了30万行,去年。 我们每个项目结束,给每个人发个小杯子,cvs上统计都发给你,呵呵。

  10. 潜龙 于 2009-11-02 11:37 上午

    30万行有点恐怖,每年工作日也就250来天,每天1200行,即使是敲进去恐怕都累得够呛。

    正常程序员编写系统代码应该是1000行/月以下,在水平一定的情况下,产率和质量之间有反比关系。

  11. 陈怀临 于 2009-11-02 12:01 下午

    Heeeee. 这个系统级的定义很模糊。唉,其实无所谓了。记者的笔有时。。。

  12. 打磨工 于 2009-11-02 2:01 下午

    这个成果难度怎样?

  13. 理客 于 2009-11-02 3:55 下午

    如果除去类似界面通用性代码,去掉空行,注释等,按照正常的工作时间,1000行/人月,我觉得对普通的程序员是相当高产了,我们都知道一个项目要把从设计到维护的时间都要算进去,而不是仅仅的纯CODING时间。这1000行/人员里实际上已经包含了质量,也就是你可以写得相当快,但写完不算完,商用才算开始,如果质量差,后期维护肯定多,把这个工作量摊给你,你还是快不了

  14. 删吧 于 2009-11-02 4:35 下午

    补充一下:小伙键盘成天敲的震天响。 得了键盘手,所以公司给他配了一个特殊的键盘和鼠标。 当然,质量是另外一回事。
    我们不是startup ,但工作时间远远超过正常工作时间。还有,你们说的是完全from scratch 的吧, 真正的总是从东从西继承点的吧,呵呵。

    我结婚前两天,因为重要的release,还硬是check in 了2千行的代码呢,我boss至少嘴上为这事跟我说了好几次sorry。

  15. 理客 于 2009-11-02 4:46 下午

    年轻有为
    正确的代码估算,是要考虑难度系数的,比如UI处理是要打折的。
    如果不是特殊情况特殊项目,质量必须放在正确的位置,否则问题很大。
    男人要敢担当,不能太顾家,但家庭很重要,内安才能更好的攘外,否则对一个普通男人,影响是很大的

  16. 潜龙 于 2009-11-02 5:08 下午

    一般商用的东西“从东从西继承”基本上是杜绝的,除了知识产权的考虑,最重要的是质量和可维护性方面的考虑。写程序也有很多形式的东西,如变量命名规则,每个软件/团队可能都不同,虽然对编译出来的二进制不一定有直接影响,但是却直接影响到关联团队和后续维护人员对代码的理解和维护。

  17. spike 于 2009-11-02 5:22 下午

    这个帖子没有说天河用的操作系统,如果这20万行代码是集成在Linux kernel里面的话,还是比较厉害的。

    anyway,代码行数确实不能反映太多东西,如果是重复地添加get/set接口或UI响应函数,那一段一段地copy/paste/modify,1000行/时的效率都是有可能,只是那个时候才确切感受到it民工的含义,感觉还没有泥工砌砖头的技术含量高。当然,如果是实现某个算法或逻辑,那可能几行代码就能折腾好几天,这个时候才能反映一个程序员的水平。

  18. qqdavid 于 2009-11-02 7:30 下午

    这个帖子没有说天河用的操作系统,如果这20万行代码是集成在Linux kernel里面的话,还是比较厉害的。

    天河用的是前段时间陈首席提及的“麒麟”操作系统,目前该系统用户可以自由下载试用

  19. processor 于 2009-11-03 4:30 上午

    民口的国家级高性能计算项目

    http://www.hpcchina.com.cn/Report_HPCChina2008.pdf

    6 Progress of Major National Programs
    6.1 National 863 Program on High Productivity Computer
    863计划高效能计算机专项除了完成2台百万亿次系统和建设CNGrid中国国家网格外,还计划研制2台千万亿次系统,以及开发面向千万亿次高性能计算机的大规模并行应用软件。
    2台千万亿次系统的用户分别是深圳市超级计算中心和天津市滨海新区超级计算中心。其中,天津超算中心的应用范围是面向以石油行业为主的工业应用,之前较大的计算基础设施是2004年6月由邓越凡教授在南开大学科学计算研究所时设计的“南开之星”机群系统,该系统由IBM公司制造,系统峰值4.7Tflops,Linpack性能3.23Tflops,在当时的Top500排名第42位。深圳超算中心的依托单位是中国科学院深圳先进技术研究院(http://www.siat.ac.cn),它为此成立了一个面向应用的机构“先进计算与数字工程研究所”。深圳超算中心的目标是成为立足深圳、覆盖港澳台、辐射东南亚的国家级超算中心,除了传统的科研教育机构,它服务的主要应用领域包括:
     大科学工程:如位于广东东莞的中国散裂中子源(CSNS),是用于高能物理研究的世界一流的脉冲中子科学综合实验装置;
    。。。。。。
    2台千万亿次高性能计算机的研制者尚未确定。

    6.2 National 863 Program on High-end Fault-tolerant Computer
    “高端容错计算机”专项的目标是针对金融、电信等关键领域的需求,研制高端容错计算机产品,打破国外产品在这些关键领域的垄断,降低中国的信息化建设成本。高端容错计算机的可用度要达到99.999%,兼容主流高端数据库和中间件,在至少两个关键领域的生产性业务系统上实现规模化应用。
    华为公司和浪潮公司获得863项目的资助,分别获得经费¥2.6亿元,到2010年底完成32路处理器高端容错计算机的研制。华为公司将采用Sun Sparc处理器和Open Solaris操作系统的技术路线;浪潮公司将采用Intel X86 QPI和Windows/Linux操作系统的技术路线,已经得到Intel公司的QPI授权。
    该项目的巨大挑战除了开发高端的芯片组和交换芯片、购买昂贵的QPI phy以外,系统软件和行业应用的移植和认证将更为巨大。它挑战的竞争对手是IBM p系列和HP Superdome系列,以及这些国际企业的服务能力。

    6.3 National Science and Technology Program on Key Electronic Devices, High-end General Chips, Fundamental Software Products
    中国国家中长期科技规划设立了16个科技重大专项,其中“核心电子器件、高端通用芯片及基础软件产品”专项2008年发布了2009-2010年课题申报指南,其中有3项与高性能计算密切相关。
    1.高性能多核CPU:技术指标是:
     采用65nm或者更先进工艺;
     片内集成4个以上64位高性能处理器核;
     主频1.5GHZ以上;
     用于国产千万亿次高性能计算机系统;

    。。。。。。

  20. KISS 于 2009-11-06 6:38 上午

    好生意啊,sparc和solaris都是开源的.

  21. KISS 于 2009-11-06 6:47 上午

    @杰夫:
    估计你是翻译HPCWire的文章吧,一个小建议,有时候还是给出原始来源/链接比较好

    至于说天河效率低,我没跑过Linpack,有兴趣的可以去求证一下:due to SPEC rules and regulations, GPUs aren’t allowed to run Linpack [SOPEoptimized code is banned], so only CPU scores are taken into place.

    http://www.brightsideofnews.com/news/2009/11/3/gpgpu-start-to-take-over-the-hpc-sector-5600-ati-gpus-deployed-in-china.aspx

  22. 大荣 于 2009-11-16 6:51 下午

    把这个顶出来,听听高人们的评论,最近的新闻里关于这个项目的讨论很多,有点打虎的感觉。

  23. ABC 于 2009-11-16 9:19 下午

    数字一:全系统峰值性能为每秒1206万亿次,Linpack实测性能为每秒563.1万亿次。这意味着,“天河一号”计算一天,一台配置Intel双核CPU、主频为2.5GHz的微机需要计算160年。

    160年 = 160*365 = 58400

    神啊

  24. aaa 于 2009-11-16 11:33 下午

    我大宋天河一号
    位列第五名在今天的Top 500 list…
    http://www.top500.org/

    Intel是最大的赢家,它的Nehalem-EP在Top500频繁出现,增长显著。这个Nehalem-EP (Xeon 5500平台)还有SoC版本Jasper Forest.

    AMD Opteron霸占了前三位。但是,显然它受到Intel的冲击。

  25. 大荣 于 2009-11-17 12:55 上午

    能讲讲为什么要做如此的高性能计算吗?我知道石油和天气预报要用。但是我不知道怎么算,不知道有人能够给个通俗的解释吗?
    另外,为什么要做GPU和CPU的混合?这个Linpack的测试有实际的意义吗?
    是真的我们做得混合模式因为对内存的访问问题所以就效率低吗?那么我们何必做一个效率低的系统呢?

  26. yuanbor 于 2009-11-17 1:11 上午

    很多应用需要大量的计算,比如天气预报,石油开采,飞机模拟,生物仿真等等,总之是越快越好;
    GPU的并行性好,峰值可以非常高,当然并不是非得CPU+GPU,如中科院计算所就采用AMD+龙芯这种异构模式;
    Linpack的测试实际意义不大,因为TOP500比较的是Linpack的值,所以大型机都得做这个测试;
    天河一号Linpack效率低是因为采用了GPU,GPU自带内存很少,而Linpack的需要大量的访存;
    不是为了效率低而做,只是因为国内大型机排名以峰值来算,而不是Linpack实测值,所以效率高低无所谓,达到千万亿次是他们的目标。

  27. lhmj 于 2009-11-17 7:56 上午

    附一个什么是Linpack 值http://blog.newzgc.com/u/1/1253.htm

  28. 大荣 于 2009-11-17 6:43 下午

    有些问题看来得不到答复了,估计真的能不一带而过回答的人也不多。
    总之不论评价如何,能用起来最好。
    弱弱的问个问题,在计算这些数的时候,这些超级计算机的电脑显示屏到底显示啥啊。我听说过去算石油的地震采集数据,有的时候要算一个月呢。是不是算这些数据的时候,主机外带的显示器都跟那里播电视剧啊,或者弄个动画片一类的。

  29. 帅云霓 于 2009-11-17 7:51 下午

    ……应该就是显示采集中,一个进度条吧。