天河一号将采用国产“飞腾”CPU?

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




image     今天看到一篇新闻,“天河一号超级计算机将拥有‘中国芯’”,文中提到:

3月8日,全国人大代表、国防科技大学校长张育林透露,由国防科技大学研制的我国首台千万亿次超级计算机“天河一号”,将在2010年安装我国自行设计制造的“飞腾”CPU芯片。

张育林介绍,国防科大研制的“飞腾”芯片是为“天河”系列计算机量身定制的,达到了当今世界主流服务器CPU的水平。“在安装‘飞腾’芯片后,‘天河一号’的峰值速度和运算效率将大大提高。”

2009年,“天河一号”全系统峰值性能为每秒1206万亿次,Linpack实测性能为每秒563.1万亿次。“今年,我们将把Linpack实测速度提高到每秒1000万亿次以上。”张育林说。

      关于天河一号计算机,弯网也有文章介绍过,我本人对它不太感兴趣,在这篇文章(国防科技大学研制成功首台千万亿次超级计算机)的留言中,我曾经说过:

对这类新闻的客观、深入报道,你不能去看《人民日报》,可惜这篇报道很像人民日报:-)。为了显示《弯曲评论》与人民日报的区别,我来说几句。

我对这个新闻不太感兴趣,因为这种计算机的计算能力能做多高,主要看你有多少钱,有多大地方,不是什么技术难题,就是一个一个(商用)CPU往一块装。

这个天河一号,用了6144个Intel CPU和5120个AMD GPU(有猜测是Intel Nehalem EP 和 AMD FireStream 9270)。CPU和GPU混用,这倒是一个比较新颖的设计。有一点值得注意,“全系统峰值性能为每秒1206万亿次,Linpack实测性能为每秒563.1万亿次”,也就是说其实测效率甚至低于50%,远低于国外同类计算机的75%左右,日本的“Earth Simulator”甚至达到了93%。

其中原因,可能有设计的问题,但估计主要是因为使用了GPU。目前的GPU的on-chip cache较小,经常需要访问内存,所以限制了其最高计算性能。

投资数亿元做这个机器,主要还是要看能不能真正用起来。从国防科大以前“银河”的经验来看,前景不容乐观。不过,可能不会影响“天河二”, “天河三”的不断推出。

      之所以又说起这个话题,是因为这个“飞腾”CPU倒是第一次听到,我对此很感兴趣。以前听说过天河一号要用龙芯,现在看来改飞腾了。如果张校长所说属实,飞腾“达到了当今世界主流服务器CPU的水平”,“峰值速度和运算效率将大大提高”,那么,这就标志着我天朝CPU研制水平取得了飞跃性的进步。这么大的好消息,咋不早说呢?非要等到两会期间才报告?

      可惜,网上能找到有关飞腾的资料很少,有人说它是国防科大研制的一款军用芯片,32比特,兼容X86。在一个论文网站中,我找到几篇国防科大的论文

银河飞腾-D4是国防科大计算机学院自主设计的新一代高性能32位定点DSP微处理器芯片,应用目标是无线基站、ADSL、雷达、图像及多媒体信息处理等高性能数字信号处理。在芯片成功推出后,基于银河飞腾-D4的嵌入式系统开发就成为一个很重要的课题

      这里说的飞腾-D4是一个DSP芯片,不知是否就是张校长说的“飞腾”?粗看起来,好像D4和Intel的最新处理器相比,还有相当大的距离。

      “飞腾”CPU到底是个深藏不露的重大技术进步,还是媒体又和大家开了个玩笑,逗你玩儿?希望知情人,和弯网中喜欢刨根问底儿的书呆子们热烈讨论一下。

 

弯曲评论相关文章:

国防科技大学研制成功首台千万亿次超级计算机

中国千万亿次超级计算机–天河一号

(3个打分, 平均:3.67 / 5)

雁过留声

“天河一号将采用国产“飞腾”CPU?”有49个回复

  1. bigrong 于 2010-03-09 5:24 下午

    首席,好像思科发布新的路由器了,啥时候有报道啊

  2. kkk 于 2010-03-09 5:40 下午

    CRS-3,332T

  3. John 于 2010-03-09 6:22 下午

    前几天和同事聊天, 其实在国内还有一家搞CPU的, 江南所. 抄片起家的. CPU/DSP都抄, 后来片子规模大了抄不了了,就搞设计. 神威是其CPU,据说得到核高基的投资. 有消息说,江南所其实比龙芯课题组活的好,是因为其背后资金来源比较充足(来自哪里呢?,读者可以自己寻找).

    实际上,龙芯从无到有,并且能量产,是了不起的.总比某些总存在于报道上面的 **CPU好的多了.

  4. 陈怀临 于 2010-03-09 6:23 下午

    各位贤弟对北京的君正有没有什么评价。据说芯片做的不错。要进军mobile市场。。。

  5. John 于 2010-03-09 6:28 下午

    >要进军mobile市场
    消息来自何处?

    君正是汉王电子书的御用CPU. 君正的优势在于, 价格低,功耗低并且同时性能还不错. 而且是 兼容MIPS(这意味着可以重用很多软件).

    总体感觉君正做事比较踏实低调. 闷声发财. 但是君正也面临一个问题: 如何平衡何MIPS公司的关系. 要注意 君正并不是MIPS的licence厂商.

  6. 陈怀临 于 2010-03-09 6:29 下午

    另外,看了一下杰夫的文章。这个”飞腾“有点忽悠。。。唉,大宋到底是怎么回事?真TNND乱。

    说良心话,华为数万之众,去年营收310亿美金。但任正非之低调,让天下英雄胆寒。。。

    这才是Hero。

  7. 素里太守 于 2010-03-09 6:54 下午

    首席同学,让天下英雄胆寒不好。

    当大宋朝遍地英雄的时候,大辽国才能胆寒;任正非的胆再肥,每天也出不了二两蛋黄,不,二两胆汁。

  8. DJ 于 2010-03-09 7:39 下午

    君正,偶曾数次与其刘总冼总会面。技术型书生气质,踏实,市场敏感度不够。先是步步高(oppo)的电子词典学习机,然后是rmvb的mp4,然后是近期创业板上市、手写起家、气势正盛的汉王电纸书,都是它的cpu。在PMP(MP4)市场曾经一度08-09年初凭借IC 4740物美价廉站在主流位置,但是后续乏力,该市场瑞芯微、珠海全胜(炬力创始人已故赵老先生出走之后创办)等激烈竞争,君正在MP4市场现在落伍了。

    近闻MIPS公司对android大力支持,这个对君正应该有实质性帮助。

    提起君正,就要说瑞芯微,一个市场导向、非常具备市场服务意识和市场敏感度的芯片公司,一个类MTK的公司。下次再说吧。哈哈。

    在中国大陆,要想商业成功,先谈市场,再谈技术。而瑞芯微的领导人,励民,对市场的把握,实在是一流的高手。

    不管怎样,在中国,真正做实事的IC(SoC,CPU based)公司,还是有一大批的,谈不上技术领先,但是先发现需求、再发现差异性、再技术上二次创新(不管降成本也好,小改动也好),有了积累,才能谈得上继续生存和创新。华为不也是经历了这样的一个阶段和历程么。

  9. richard 于 2010-03-09 8:10 下午

    我看瑞芯微也没传说中的那么强,一个朋友用它们的片子开发卖到美国的移动电视,先用标清的开发,结果到美国一看人家都高清了,想用瑞芯微的高清片子,但是片子老出不来,项目只好搁置,团队也解散了。

  10. PVT 于 2010-03-09 11:19 下午

    杰夫先生对天河一号的评论有点外行。
    真正搞GPgpu的都知道,cup+gpu的结构
    看起来峰值性能很高,但gpu毕竟是专门为图形处理设计的,用在通用计算上效率很低。
    世界超级计算机TOP500排行上除开天河一号, cup+gpu结构的机器还有几台。这些机器的效率一般就在30%上下,最好的是日本的一台机器,其效率经过几次优化后才跟天河差不多。由此可见天河一号的技术关键在于gpu进行通用计算时的效率优化 ,其水平绝对是世界一流的!amd的显卡跑出这个效率amd公司本身的研究人员都非常吃惊, 还主动联系天河一号的研制人员进行合作研究。

    关于飞腾cpu其实到中国期刊网CNKI上搜索一下就可以搞清楚基本情况。
    国内研制高性能通用微处理器比较成气候的单位有3家:

    1、中科院计算所 的龙芯 基本情况大家都知道,就不罗嗦了。

    2、江南计算技术研究所,就是著名的国家最高科学技术奖获得者金怡濂曾任所长的单位,实际是军方的研究单位。 他们也是搞巨型机的。对外公开叫神威 实际是神州系列巨型机,该系列的某型号性能曾一度超过当时排名TOP1的机器。他们的机器一直使用alpha系列的cpu ,本世纪初EDC公司倒闭,alpha系列没有了后继型号。于是该所购买了alpha21264的hardcore,在此基础上对21264进行了改进,先后研制了sw-1、 sw-2系列的高性能cpu ,sw已经生产的系列 使用中芯0.13微米工艺,最先进的型号为双核1.4Ghz。研制中的新一代cpu为众核结构,65nm以下工艺 频率1.6G以上。
    该系列cpu已经于数年前运用在sz某号巨型机上,领先曙光5000 一年多推出了百万亿次级的巨型机。由于其军方性质且产品完全用于机密用途所以其研究成果基本没有公开过。该所现正在研制万万亿次的巨型机,将使用研制中的sw新一代cpu。

    3、国防科技大学计算机学院
    他们研制的银河系列巨型机为大家所熟知,但网上能够查到的只到银河4为止。其实银河系列的研制一直在进行,只是因为后来的机器用于特殊用途故未有公开。现在大家知道的天河一号是他们面向地方研制的机器。
    国防科大的cpu叫银河飞腾系列,型号很多。主要包括: 飞腾dsp-仿制TI各个系列的dsp;飞腾586-仿制Pentium MMX;飞腾64系列 -包括仿制安腾,在imagine基础上研制的流处理器,最新的是在 Niagara 2 的基础上改进的8核cpu,预计将要用在天河2号上。

  11. 杰夫 于 2010-03-09 11:23 下午

    PVT,great info,受教。

  12. FT 于 2010-03-09 11:55 下午

    TEKTALK的水真深啊
    现在讨论已经接近军方机密了……..

  13. DJ 于 2010-03-10 1:04 上午

    richard,瑞芯微是个市场驱动型公司,他看好的市场,自己就去做芯片连带产品的total solutions了,他的芯片刚刚好适合他自己调研好的目标市场,你想用于其它新的market基本不可能。
    君正恰好是个平台型公司,他的SoC出来,不是很针对具体某个产品开发,产品公司可以自己发挥。

  14. deltali 于 2010-03-10 1:27 上午

    君正的刘强最早是在方舟作芯片设计的老大,而方舟是最早一批给日立作sh芯片外包的团队转化而来,因为通过外包才有了一支软硬件都有的队伍。只可惜方舟中途撤退,刘强就自己拉出来继续自己的cpu梦想。老杳的博客上说刘强和胡伟武在中科院的时候还是同学,但是走的路却是大相径庭。
    君正虽然设计都在北京,但是是从深圳起步,05年的时候跟深圳诺亚舟就有合作了,应该说在市场拓展方面远胜龙芯。
    说实话,刘强还是不容易的,至少从媒体方面可以看到国家没给他们一分钱,就靠他们原来的团队把市场给做出来了。其实都是基于mips的东西,国家给龙芯的东西可以考虑分一部份给像君正这样踏踏实实地公司了。

  15. 老韩 于 2010-03-10 3:15 上午

    涉密的问题要控制……不想弯曲被GFW

  16. 黄岩 于 2010-03-10 4:57 上午

    - “因为这种计算机的计算能力能做多高,主要看你有多少钱,有多大地方,不是什么技术难题。”

    这个不太同意,尤其“不是什么技术难题”这句。我没做过“高性能计算”,但是评直觉猜测,天河项目至少要提供一些软件工具,要能够把linpark的测试用例编译通过,并运行出结果。

    - “投资数亿元做这个机器,主要还是要看能不能真正用起来。从国防科大以前“银河”的经验来看,前景不容乐观。”

    这个严重同意,linpark能够跑出结果,不代表这个东西能够用于模拟核爆炸。在国内,凡是国家投资的科研项目,效率都很低,花费都不菲。这是现状,估计近期不会改变。

    但换句话说,像CPU、高性能计算机、航天飞行器这类东西,即便效率低,也必须有国家来支持。

  17. 黄岩 于 2010-03-10 5:01 上午

    补充:CPU+GPU,要运行linpark,可能需要考虑很多条件,最容易想到的,如:a、如何把那些线性解方程组的fortran程序同时编译为CPU和GPU两种代码?那些编译为CPU代码,那些部分生成GPU代码?b、任务如何在CPU和GPU之间平衡分配?c、如何让CPU和GPU很好的协同工作。

  18. 老魏 于 2010-03-10 6:41 上午

    评论当代有点风险,要不讲讲以前的??
    “从国防科大以前“银河”的经验来看”
    能否展开讲讲,都哪些经验。

  19. 长沙一小民 于 2010-03-10 7:06 上午

    各位讨论某些问题最好还是就此打住吧,有点湿鞋了啊…

  20. 陈怀临 于 2010-03-10 7:10 上午

    咔咔咔咔,天地良心,这与陈首席一点关系都没有的。长沙工学院的弟兄们,我对你们在最落魄的时候,只有我是挺身而出,支持你们计算机系的。那时,多少愤青多我失望呀,说我支持。。。

  21. 杰夫 于 2010-03-10 10:26 上午

    这类计算机的新闻,主卖点都是一秒钟多少亿次运算,排世界第几等等。没人上来就说我的计算机可以run Linpack,这可很难啊。 Linpack porting当然需要一些工作量,但在100个CPU和10000个CPU上工作量相似。那么,要做10000个CPU机器的Barrier不是技术,就一个,钱,无它。

  22. xyb 于 2010-03-10 5:55 下午

    江南所,就是解放军电子56所。。

  23. 网路游侠 于 2010-03-10 6:09 下午

    效率太低,如果只是Intel和AMD的CPU堆砌,那么实际上没有任何意义,只要有钱,弄99999个CPU速度更快……就像电磁炉,判别的标准不是一次可以供给多大的锅,那个只需要并联N个电磁炉就行了,但是很少见有比1度电能烧开多少水的?国内就这样搞,面子工程……烧纳税人的钱。

  24. spike 于 2010-03-10 6:33 下午

    弯曲上CPU和IC design的人才真是多啊,见识了见识了

  25. Multithreaded 于 2010-03-11 7:50 下午

    #17, 还没有听说这种事编译能自动做的, 都是靠手工来完成的。有兴趣地可以到PPoPP的会议录上去找。

    虽然有点吹过了,但国防科大这支队伍还是有点功力的。 中国的第一篇ISCA就从他们中出的。

  26. Multithreaded 于 2010-03-11 7:54 下午

    #23。 其实难点在判断故障在哪里?当这么多的机器同时工作时,除了CPU最稳定外,memory, network, disk can be broken at any time :-(

  27. gradetwo 于 2010-03-14 1:05 上午

    别的不了解,56所的加密机性能比30所的差得有一比.

  28. 小胡 于 2010-04-04 11:04 下午

    天河一号的CPU是飞腾64(FT64 – a stream processor). 在IEEE上有很多文献.

  29. jerry 于 2010-04-05 1:41 上午

    奇怪为什么FT64 不和Nvidia的CUDA比比,都是stream processor. 内行人能否透露一下他们是用什么工具综合的,主频500Mhz和Nvidia的比差多少?

  30. daseny 于 2010-10-28 9:56 下午

    这个将来时已经变成过去时了,新闻上说CPU叫飞腾1000。

  31. 楼上楼下 于 2010-10-29 6:21 上午

    放卫星咯

  32. asd 于 2010-10-30 6:55 上午

    无锡的江南所吗?声名远播啊。兲朝山寨能力很强大,不过这也是弱者的必由之路。
    IC特别在数字领域,反向已经没有意义了。我倒是似乎没有看到国家在制造工艺上的大投入或者是显著产出,哪位大牛给讲讲。看看TSMC的季度营收接连出新纪录,成都那边却又卖给TI。有没有大牛熟悉工艺的,不久前SMIC还只有130管用,据说现在65也开始了,自己很久没更新这方面信息

  33. xxx 于 2010-11-01 4:09 上午

    反向工程没意义,开源代码更给力!
    现在互联网上资料这么多,弄点开源的东西也能从国家搞到钱吧,比如说麒麟操作系统。

    飞腾1000,网上有传言说是出自sun的开源dsp,不知道是真是假

  34. anonymous 于 2010-11-01 9:00 下午

    学习不丢人,抄袭才丢人。sun开源的sparc不知道国内有没有公司关注。

  35. SUN 于 2010-11-16 8:37 下午

    楼上的,飞腾1000抄袭的就是opensparc T2,这年头只有不说是自主知识产权的才是真正中国人的发明创造。麒麟操作抄了FreeDSB,还贿(水产)赂GFW封人家网站,对开源真是一种侮辱。

    BTW:天河效率接近50%是因为AMD/ATI产的新显卡板载显存大了(几年前还是最大256MB现在已经是1~2GB了)别为这帮骗钱的脸上贴进了…

  36. 陈怀临 于 2010-11-16 8:41 下午

    用opensparc到无可非议。说清楚就好。我曾经倒是看过一阵openrisic的东东。。。

  37. Coder 于 2010-11-17 6:09 下午

    说清楚了,名正言顺。白痴才从头搞CPU。说自主研发其实是说自己白痴。我们这有一些国防科大来的交换学生,平均水平之差,不可想像

  38. 过客 于 2010-11-17 6:31 下午

    我上学的时候没有交流生,不知道内情。但是我儿子初中和某日本学校有交流计划,我感觉交流条件是要有钱。

  39. bugggg 于 2010-11-17 6:54 下午

    to Coder

    交换学生 访问学者之类的本来就是来旅游的
    你指望多好

    我们这的访问学者来这半年 把我前n年玩过的地方全玩了一遍

  40. coder 于 2010-11-17 6:57 下午

    中国政府发了,每年公派大批留学生。不过他们军队去美国不好弄,只好来大农村。 希望国家别老派 考试高手,政治思想能人 和 老师关系户 擦…

  41. 过客 于 2010-11-17 8:43 下午

    现在有很些高校招生喜欢搞什么面试,这种方法就是要讲贫寒子弟拒之门外啊;香港高校刚来内地 招生时,也是非常高调地高傲地宣布要亲自面试合格才行,好像今年就取消了面试,因为隐含着录取不公平的问题。

  42. aaron.chen 于 2010-11-17 9:12 下午

    呵呵,杰夫的这个说法,不敢苟同:

    这类计算机的新闻,主卖点都是一秒钟多少亿次运算,排世界第几等等。没人上来就说我的计算机可以run Linpack,这可很难啊。 Linpack porting当然需要一些工作量,但在100个CPU和10000个CPU上工作量相似。那么,要做10000个CPU机器的Barrier不是技术,就一个,钱,无它。

  43. 想说点真心话 于 2011-04-13 5:47 上午

    为什么对国产的东西就那么刻骨地仇恨呢?
    对别人的东西不要评,有本事自己也为我们国家拿出点真东西来。
    有谁不知道,中国在许多方面是与别的发展国家有差距,出一点东西,不鼓点劲,行吗?又怎么了?又怎么刺激某些人的神经,什么时候能听到国人多说点鼓励的话,自己每人干好自己的事,把你自己的事能拿得出手的也拿出来看看,不更好?!!!
    我们是一群老同志就想多看见国家的发达兴旺,只要不是无中生有,不断努力,我想应当是好事。是应该发杨的呀!!!

  44. simida 于 2011-04-13 6:23 下午

    楼上的别生气,在国内高校和科技界呆久了,中国的科研是怎么回事,大家还不清楚吗?骂得就是这种中国目前社会的现状,非针对万事

  45. yy 于 2011-04-15 4:46 上午

    to # Multithreaded 于 2010-03-11 7:50 下午

    #17, 还没有听说这种事编译能自动做的, 都是靠手工来完成的。有兴趣地可以到PPoPP的会议录上去找。

    虽然有点吹过了,但国防科大这支队伍还是有点功力的。 中国的第一篇ISCA就从他们中出的。
    ————————————————-
    头两篇应该81年计算所和复旦各中的一篇吧!
    http://hi.baidu.com/microarch/blog/item/458c308f0a3b4119b31bba8e.html

  46. 一条虫 于 2011-04-19 2:43 上午

    用AMD 显卡的人都知道他们家的GPU驱动是烂得一比吊X。他们惊讶这边用得那么好是正常的。要不是封闭芯片开发资料,开源驱动早就把他的正统挤一边去了。

    各个参数都超过NV,跑分那是刚刚的。一上真游戏就歇的叻

  47. Multithreaded 于 2011-04-20 2:07 下午

    #45, 对不起! 时间久了,我把夏老师和高老师的文章忘掉了 :-(

  48. westermann 于 2011-04-22 8:29 下午

    >>>要不是封闭芯片开发资料,开源驱动早就把他的正统挤一边去了

    open source社区和AMD/ATI有协议的,AMD/ATI也开放了3D加速的spec向社区的,在http://www.x.org/docs/AMD/下你可以找到。当然,video/mpeg加速因为第三方ip问题不能向社区开发。

    开源的没有这么神,就算有AMD/ATI的3D spec,开源驱动(radeon)在一些很简单的profile测试中也是完败于AMD/ATI的闭源fglrx driver,差距不是一点半点。当然,开源驱动强在linux上的稳定性。

  49. 一条虫 于 2011-04-22 10:29 下午

    没有全部开放。。。部分而已。而且多数陈旧了。AMD 连Freebsd的驱动都没有而Nvidia早就开始同步FreeBSD的显卡驱动了。在软件驱动方面他们的弱势是显而易见的。我意思是,如果全面开放,还真不好说。