中国拟定自主指令集架构标准?

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




中国政府正着手打造一个能够作为全国计算机芯片的统一指令集架构,也就是全国统一的CPU架构标准(ISA)。不过相比于国产CPU本身,自主CPU的周边生态系统才是一个CPU能不能持续发展的主要因素,想想当年Wintel是如何实现双赢的。

55
如果该项计划顺利完成,就有希望做到CPU国产自主化,将应用于与政府有合作关系的国企、央企和私企等等。像是有背景的政府采购,还有国家的研发项目、包括中国移动等电信运营商也毫无例外的要采用这一标准。此举的目的非常明显,就是要降低对西方国家技术知识产权上的过分依赖。

目前已经甄选出来的共有五种架构及备选:

ARM

ARM(Advanced RISC Machines),既可以认为是一个公司的名字,也可以认为是对微处理器的通称,还可以认为是一种技术的名字。

ARM芯片
ARM芯片

ARM处理器是一个32位元精简指令集(RISC)处理器架构,其广泛地使用在许多嵌入式系统设计。

ARMv8架构
ARMv8架构

ARM作为苹果、Acorn、VLSI、Technology等公司的合资企业,其本身并不生产芯片,只将芯片技术授权转让给其他厂商,但是ARM在移动智能芯片市场的占有绝对的优势,近年来随着智能手机以及平板电脑的走红,ARM也从名不见经传到为数码爱好者所熟悉。

目前中国共有34家公司持有ARM架构的许可证,但仅Cortex-A9芯片的许可证,ARM公司就要价500万美元,因此ARM可能不太会得到青睐。

Power

POWER是IBM开发的一种基于RISC指令系统的架构,相对于我们常见的X86架构的处理器,采用POWER架构的处理器具有结构简单和高效率的特点。

为了市场发展的需求,IBM公司联合Apple和Motorola两大巨头合力研发了基于POWER架构的新一代的PowerPC构架。PowerPC在低功耗和处理性能上都非常出色,同时它又具有与POWER架构软件完全兼容等特点,在嵌入式系统领域和IBM的超级计算机中都被广泛使用。

1
IBM Power架构

POWER架构首次大批量出现于1990年,IBM公司为满足客户对工作站以及可以支持UNIX操作系统的中型系统的需求发布了RS/6000系列产品,这一系列产品主要由POWER架构实现。

2010年2月8号,IBM在纽约正式发布了其Power7处理器。在x86处理器Nehalem占据人们视线许久之后,作为CISC外另一处理器常见架构RISC的Power系列CPU蛰伏三年后终于推出新品:Power7处理器

相比上一代的Power6处理器,在多核、多线程方面有了很大提高:POWER6只有双核,而Power7达到了8核,且每核最多可以并行执行4路线程。虽然主频较上一代降低了,但仍有4.14GHz,例如同为八核的Nehalem-EX主频在2.66G至3GHz之间。UltraSparcT2处理器则只有1.4GHz。不过UltraSparc T2有8核64线程。这比Power7的8核32线程以及Nehalem-EX的8核16线程、安腾9300的4核32线程都要多。

power7
Power7

价格
图4:部分Power7服务器价格

750
Power7服务器

POWER4,POWER5,POWER6以及POWER7处理器和其他厂商生产的POWER PC处理器都是采用这个架构的。目前POWER架构的处理器广泛在各个领域采用,大到超级计算机和跨国企业的UNIX服务器,小到蜂窝电话、车载系统的设备,都有它的身影。

Power架构相对便宜,不过它缺少像MIPS和ARM架构那样具有活力的软件生态系统。

MIPS

MIPS是世界上很流行的一种RISC处理器。MIPS的意思是“无内部互锁流水级的微处理器”(Microprocessor without interlocked piped stages),其机制是尽量利用软件办法避免流水线中的数据相关问题。它最早是在80年代初期由斯坦福(Stanford)大学Hennessy教授领导的研究小组研制出来的。

我国自主研发的龙芯便是基于MIPS,目前在百万计的学校计算机上都能看到。

龙芯
龙芯

1
龙芯处理器

中国于2002年起投资50亿美元开发龙芯处理器,32位的龙芯一代运行频率只有266 MH;二代是64位,速度提高至1.2 GHz;针对服务器的龙芯3A处理器推迟一年推出。

它采用65纳米制造工艺,主频1 GHz,浮点运算16 gigaflops,有4.25亿个晶体管,功耗只有10瓦,芯片集成了4个核心,两个16位HyperTransport 1.0控制器,4MB二级缓存,内存控制器支持DDR2和DDR3;龙芯3B同样是65纳米工艺,主频仍然是1 GHz,集成了8个核心,每个核心2个256位矢量协同处理器,5.83亿个晶体管,浮点运算128 gigaflops,功耗40瓦。

龙芯发展图
龙芯发展图

龙芯发展到现在,10年的时间里已经发展到了第三代。从当初的龙芯1号到现如今的龙芯3A、3B。英文名从起初的Godson到现如今Loogson,从当初的应用在玲珑笔记本,到如今要实现超级计算机上完全应用龙芯。龙芯CPU的性能据称已经达到64位,以这样的速度不知20年后能否实现赶上美国水平。

龙芯期间从轰动一时到渐渐淡出人们视线,期间很大的原因在于龙芯与MIPS架构的说不清道不明的关系,从最初的法国意法半导体公司合作,再到后来购买MIPS指令授权。

MIPS公司的R系列就是在此基础上开发的RISC工业产品的微处理器。这些系列产品为很多计算机公司采用构成各种工作站和计算机系统。 MIPS是出现最早的商业RISC架构芯片之一,新的架构集成了所有原来MIPS指令集,并增加了许多更强大的功能。

由于MIPS技术公司最近经营不善,因此有传闻认为,这家位于美国加里福利亚森尼维耳市的公司很可能逃不出被收购的命运。对财力雄厚的中国政府来说,从资金上来讲,收购MIPS技术公司绝对是小事一桩,我国政府有足够的纳税人来支付这笔交易。

Alpha处理器

Alpha处理器最早由DEC公司设计制造,在Compaq(康柏)公司收购DEC之后,Alpha处理器继续得到发展,并且应用于许多高档的Compaq服务器上。自1995年开始开发了21164芯片,那时的工艺为0.5mm,主频为200MHz。1998年,推出新型号21264,当时的主频是600MHz。

而中国首台超级计算机神威蓝光MPP的神威处理器,则是基于Alpha架构。由国家并行计算中心研制,处理器采用的8704片16核的申威1600,其最大特点是核芯处理器全部采用国产CPU申威1600处理器

神威蓝光
神威蓝光

目前较新的21264芯片主频达到1GHz,工艺为0.18mm。在该芯片具有完善的指令预测能力和很高的存储系统带宽(超过1GB/s),并且其中增加了处理视频信息的功能,其多媒体处理能力得到了增强。

神威蓝光高效能计算机
神威蓝光高效能计算机

神威蓝光高效能计算机介绍
神威蓝光高效能计算机介绍

神威Alpha架构有可能最终入选,可它仍无法与MIPS的用户基础相抗衡。

本土研发的CPU

自从1991 年以来CPU的架构就未曾有过大的变化,但现在CPU的发布改变了这一切,它完全由中国自主发展。可以说是CPU领域的一大进步。

国内超级计算机排名第一的天河1号已经尝试着试用国产CPU,天河1号采用了国防科大研制的飞腾-1000处理器,但并不是完全采用。而神威蓝光则是跨时代的全部采用国产CPU。

早在2009年,中国工程院院士、国家并行计算机工程技术研究中心主任金怡濂就说,中国完全有能力采用国产CPU(中央处理器)芯片,在短期内完成国家千万亿次巨型计算机的研制任务。本次的神威蓝光恰好是其预言的印证。

在国产处理器三大系列当中,国防科大的飞腾系列、中科院计算所的龙芯系列、都在此前有过风光无限。

备选

中国发布一种全新的架构作为标准。除了上面提到的五种待选架构外,中国的决策层还有意表示,发布一种全新的架构作为标准。在今年三月份的时候,由华为、中兴等企业代表以及多位政府官员、高校老师召开了一次全国性指令集架构的第一次会议。根据MIPS的副主席所说,在未来的几个月最终的结果就会公布于众。

说到备选方案,开发一个全新的架构。这是一项让人望而却步的工作。因为需要从零开始,这将耗费大量的人力物力,去开发软件(编译器,培养程序员,码软件),硬件(CPU,芯片组,主板等),创建一个由软件和硬件共同组成的生态系统。

http://servers.pconline.com.cn/news/1204/2763331_all.html#content_page_1


近年来中国越来越注重本土自主的设计标准协议,而不仅仅是从国外企业购买设计专利。例如,中国已经在从CD/VCD播放机到视频监控系统上有着自己的标准。另外在通信技术上,3G通信网络技术的TD-SCDMA标准就是由中国制定,而同时中国移动对4G标准TD-LTE的研发也是稳步进行。而对于自主处理器的研究,中国已经有了数十年的历史,其中的代表龙芯,是基于MIPS架构设计的国产CPU。不过业内对于龙芯的态度褒贬不一。

除了龙芯之外,在国产处理器三大系列当中,还有国防科大的飞腾系列、江南计算所得申威系列。

国内第四个超级计算机中心济南中心2011年10月底正式挂牌成立,作为全国3个千万亿次超级计算中心之一,其采用的神威蓝光高效能计算机,由国家并行计算中心研制,按照MPP万万亿次架构设计,处理器采用的8704片16核的申威1600,其最大特点是核芯处理器采用国产CPU申威1600处理器。

神威蓝光

目前,我国至少有6个现成的处理器架构是新标准参考的样本,而提议的未来处理器标准既有可能是现有架构,也可能是另外自行建立一个新的指令集架构设计。

国产CPU的看法

对于此次中国拟定自主指令集架构标准的举动,国内外人士都发表了各自的看法,例如MIPS以及ARM的人士。

MIPS技术发展部门的发言人Robert Bismuth表示,对于选择制定处理器架构标准的小组这样说,这是一项花费数月的工程, Bismuth还预测,龙芯将会是中国处理器指令集架构标准的最终选择。

虽然中国目前有一些基于MIPS架构的处理器,但是MIPS可能会最终要求购买他们的设计专利。制定国家标准可以让那些市场份额下降的企业重新看到希望。

例如龙芯在05年爆出95%类似MIPS以及09年正式获得MIPS架构指令授权的消息,使得龙芯的“自主”备受大家质疑。

对于一些想要降低成本的中国电子企业来说,购买ARM架构授权太贵,因此我们不仅仅只有ARM一个选择,PowerPC也是有计划的。

购买ARM Cortex A9架构许可需要约花费500万美元,这个价格的高低会是平板电脑选择PowerPC还是ARM处理器的一个重要考虑因素。

ARM的专家对于此次中国处理器标准的计划,也是有着关注。ARM的发言人Tudor Brown在一封邮件中透露,ARM当然注意到了这个研讨会,实际上这个问题已经讨论很久了,

Brown表示,ARM理解中国对于本土的处理器指令集架构标准的渴望,将会和主要的人士继续探讨合作。

Brown认为,制定系统指令集架构是一个相对短期的活动,但是建立和发展一个有活力的生态系统则是一项长期的工程。最重要的问题不是系统指令架构本身,而是基于系统指令架构周边的生态系统。

在中国芯片制造业,ARM的34项专利主要集中在手机系统上,其他也有涉及,MIPS则是有超过20项专利技术

在全球电脑市场,英特尔和x86机构占据了主要的份额,在中国也是如此,与有着如此优势的巨头对决,创造一个新的处理器架构的生态系统将是一个十分困难的事。

不管怎样,中国还是希望拥有自主的CPU设计,MIPS的Bismuth说道,想要一个通用的软件生态系统唯一的办法是的一个通用的系统指令架构集。

Bismuth预测中国会乐意购买一个目前存在的一个架构专利授权,并且开发出一个特有分支来,以降低中国相关产业购买授权的成本。

(2个打分, 平均:4.00 / 5)

雁过留声

“中国拟定自主指令集架构标准?”有8个回复

  1. huang 于 2012-05-04 10:58 上午

    我觉得如果不能彻底买断的话他们是不会买的…单单一个授权根本不能满足他们..搞统一架构明显就是为了有自己完全独立的核心技术

  2. WISCO 于 2012-05-04 7:20 下午

    “不过相比于国产CPU本身,自主CPU的周边生态系统才是一个CPU能不能持续发展的主要因素,想想当年Wintel是如何实现双赢的”
    这个事重中之重呀!

  3. kevint 于 2012-05-04 8:29 下午

    怎么说呢。中国科技界在高铁之后抽上了“市场换技术”的大烟现在已经上瘾戒不掉了。以前的WAPI让人一个耳光打没了。现在TD还是个半吊子半死不活的烧着钱。搞这个CPU也没什么区别。

  4. ork 于 2012-05-07 6:00 下午

    这个CPU也是半死不活的烧着钱。

  5. 2b青年. 于 2012-05-07 10:02 下午

    各位等着看笑话吧. 还找央企合作? 呵呵

  6. hid 于 2012-05-09 7:29 上午

    MIT 计算机科学家 Scott Aaronson宣布将向任何证明在真实世界中量子计算机不可能造出的人奖励 10 万美元。现在,另一位名声不佳的理论物理学家 Joy Christian 决定如果有一天有人在实验室中制造出真正的量子计算机,他将给 Aaronson 20 万美元。

    两人打赌的焦点之一是贝尔不等式,贝尔不等式认为“没有任何关于局域隐变量的物理理论可以复制量子力学的每一个预测”。

    Christian 发表了多篇论文否定了贝尔不等式,但他的论文被认为存在错误。Christian 认为没读过他的论文的 Aaronson 没资格评判他的工作

  7. xooxl 于 2012-05-11 1:23 上午

    又是一个院校/企业联合一起骗钱的招。重点到最后都是纳税人买单。

  8. Li Yan 于 2012-05-29 3:04 上午

    可能是新的RISC+SIMD
    纳税人的钱用来搞科研比投资房地产靠谱多了