多核系统与网络设备的大讨论

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




在《弯曲评论》发表了NetLogic买断RMI的文章之后,得到了许多读者的关注,并引发了对多核系统微处理器的热烈讨论。其中讨论的话题有:RMI的前途,RMI与其竞争对手Cavium的相关比较;后来话题扩大,读者开始讨论:x86架构,MIPS,ARM,PowerPC等在通信设备领域的优缺点。在讨论中,读者的评论中涉及打大量的最新技术和体系结构。笔者对每个评论都做了详细的阅读。并将安排自己的时间做相应的阅读。

关于多核系统,各种ISA体系结构方面,笔者在这方面的经验和思考是这样的。

应用系统决定论:
应用决定系统,系统决定硬件。换言之,是应用程序决定一切。而不是有了什么好的处理器,才有什么好的系统设计,才有什么好的应用。任何一个通用处理器设计,一个网络处理器设计,都是有其要服务的系统,要服务的应用,要服务的市场,一步一步决定其逻辑功能部件的。换言之,不需要的部件,即使从计算机体系结构的角度再好再美,都会被无情(但正确)的从die上去除出去。笔者在参与设计处理器时,经常遇见这样的事情。一开始确实不适应。但慢慢的就理解了:只有是应用的,才是正确的,也才是最佳的。最佳就是一个带有时间和空间的一个定位。能在某个时间段服务于某个产品从而获得某些市场,如果一个芯片能够为这个目标服务,这就是最佳的。

RMI与NetLogic:

简而言之,是MIPS多核+TCAM的组合。 TCAM是各大通信公司,特别是路由器公司的七寸。你算法再好,你也得Lookup快不是。读者可以试想下一代RMI的XLR或者XLP芯片有了TCAM的接口(Interface)。有兴趣的读者可以阅读笔者撰写的“思科QuantumFlow处理器及其战略研究(7):体系结构(报文观点)”从而比较思科的QuantumFlow网络处理器的体系结构。从技术上而言,RMI与Netlogic是一个非常不错的整合。

MIPS的问题:
基于MIPS的32位操作系统,或者网络系统,具有非常大的局限性。这就是MIPS的天生缺点。2G之上的空间必须在Priviledge模式运行。这对于网络大系统,例如在下面读者aaa的评论中提及的:“aaa 于 2009-06-07 6:35 am 大地址空间,大内存的需要越来越迫切,尤其在高端的系统.64bit core 是一种发展趋势.”。这是一个非常精确的评论。从笔者的眼中,aaa读者的此言一出,笔者立刻能判断其工作的相关性质,工作范畴和能力。可谓评论中之精华。MIPS 64位系统是已经采用和将要采用MIPS ISA的系统和公司要非常注意的一个事情。要知道,问题不在MIPS本身,而在于你现在的历史代码,历史系统是否准备好(READY)了没有?32位系统朝64位系统的迁移绝非一日之功。要下定决心,但要非常慎重。

ARM朝高端系统方向发展:
这一点确实是正在发生。读者要注意,ARM朝高端发展的含义其中包括:通信设备厂商用ARM的软核设计其高端的网络通信处理器。可类比的是:思科的SPP和QuantumFlow利用了Tensilicia的Xtensa(类MIPS ISA)处理器。这方面,笔者点到为止。

PowerPC的落后:
FreeScale确实做多核方面动作缓慢,令人失望。但PPC的社区势力强大,而且随着IBM要开始与思科一绝高低,IBM必将发力在通信,存储,数据中心等等领域,从而与思科决战。因此,IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。

IA32和EM64T的野心:
Intel在IA32方面与嵌入式系统基本无关。另外在Netburst微结构时代的Intel微处理器,基本上不可能使得通信设备厂商的板子的功耗budget,散热等等方面能做得下来(电源系统,风扇系统可是一个通信设备的两大重要部分)。但Intel在转向Core微结构和现在的Nehalem微结构后,Intel芯片的生命可以说是非常的健康和旺盛。随着外网总线,互联技术的不断发展,不排除工业界的OEM厂商,例如,台湾,韩国等等,会使得中低档通信设备的Fabric,IO卡,数据处理卡等等都迅速山寨化。换言之,决战都在软件,而非硬件。如果这一天到来,基本上意味着中小型公司单独做网络处理器变得没有任何意义,除了网络通信大公司购买CPU的软核自己定制网络处理器。再出类似于RMI和Cavium这样的公司的前提将基本上不再存在。

当然,上面都是笔者自己的一家之言。有兴趣的读者可以详细阅读众多评论如下。

#  Sunny 于 2009-06-01 5:18 pm edit

”估计RMI的员工基本上不可能挣什么钱“ 老陈真体恤民情呀! 团队是fabless的根本,团队要散了,就啥都没有了。
# 陈怀临 于 2009-06-01 8:35 pm edit

观察XLP和XLR,从网络的角度,最大的就是加了一个POE–Packet Order Engine。可以回顾一下Cavium芯片。。。我个人非常认可这一点。否则,拿软件做Packet Ordering,高端系统确实不好做。
# abc 于 2009-06-01 9:04 pm edit

应该说,XLP最大的变化是对CPU核的增强,据说单个XLP核,在同频率下较XLR性能高一倍以上
# Panabit 于 2009-06-01 9:36 pm edit

很想知道XLP的POE的详细参数和细节。不知道同Cavium的SSO比,有什么特点。
# matrix 于 2009-06-02 1:36 am edit

XLP vs. XLR
1.主要是cpu core上,XLR core是一个multi-threading标量处理器,主要面向network throughput优化(目标是memory/IO密集型业务)
而XLP core是一个4-issue,out of order,4-threading(SMT)超标量处理器,对于主控平面(计算密集型业务)和数据平面(memory访问密集型业务)都很合适。同时由于采用40nm技术,主频得以提高。所以简单地说,XLP 1 core性能是XLR 1 core 3倍。

2.POE(packet of order)引擎的引入

3.接口的变化.XLR算是10Gbps方案,XLP则是40Gbps方案。XLR support 2 XGMII/2 SPI4,4GMAC,HT.XLP support Interlaken(40Gbps),XAUI(40Gbps),pcie(16lane,2.0)

4.支持4片XLP芯片间full mesh互联(inter-chip-connect,ICI),并保证跨芯片cache一致性和芯片消息环(Fast message network,FMN)处理一致性,用于高性能计算和100Gbps
# Jerry 于 2009-06-02 3:37 am edit

据说RMI的每个员工都有不少股票,这次他们能够赚不少钱了吧!
# 老韩 于 2009-06-02 5:15 am edit

个人认为XLP内置的RAID5、6运算加速是重点。据说RMI行业收入的最大头是存储,存储无处不在,相比之下通信和安全太小了。而未来的存储一定是IP 的天下,XLS已经做到了TCPOffload,加上丰富的接口和PCI-E 4x,做HBA没有问题。现在XLP再一出来,做存储控制器应该也没问题了。
# 陈怀临 于 2009-06-02 5:56 am edit

通常而言,RMI完了。Game Over了。如果对投资有兴趣的话,可以考虑购入Cavium的一些股票。当然,我的意思你如果你觉得投资这个sector有兴趣。
# slopover 于 2009-06-02 6:39 am edit

可怜的RMI,事件是无情的,不知道Cavium会怎样
# 多核产品经理 于 2009-06-02 7:00 am edit

”估计RMI的员工基本上不可能挣什么钱“这句话应该是对的。据说RMI在中国的团队比较大,我想接下来就是裁员了,在中国!

本人接触过RMI的中国的技术支持,大部分都是从华为、中兴和当年的华三出去的。这些技术支持的技术能力还是很强的,RMI在中国凭借着支持团队优秀的支持能力战胜了Cavium,进入了无线、安全以及数通领域。

相比之下Cavium在中国市场的技术支持能力比较弱,在中国没有战胜RMI并不是因为的多核处理器本身,而是因为他们没有注重本地技术支持。

XLP能搞定的事情,我相信Cavium的多核处理器肯定同样能够搞定!只是我们关心的是使用哪一个会更容易,更迅速的产品化,那就不得不考虑本地支持能力。

Game Over了,也许这是Cavium的一个机会,在中国战胜RMI的好机会。他们裁员你就招人,用这些人重新占领。呵呵,看来Cavium的股票要涨价了。
# Jim 于 2009-06-02 7:45 am edit

这次收购RMI的员工可能要倒霉了,从技术上来说RMI比NetLogic强的多,也更有发展, 但是运营是Netlogic的强项。 老板是很爽的,但是RMI下面的员工恐怕股票要打水漂了。
# 陈怀临 于 2009-06-02 8:15 am edit

我从RMI的结局,也在思考龙芯的命运。RMI的创办人和团队的技术实力与计算所打个平手应该不为过吧。你胡伟武为了中华民族复兴:-),RMI员工做 startup为了生存与活命。不应该说人家工作不勤奋。这么多的account(客户),但volume上不去,结局仍然是这样的黯然出局。

龙芯,以MIPS ISA为起点,以Linux做宿主操作系统结果目标却是通用计算机和家庭上网本。即使龙芯3流片成功,x86指令系统能虚拟化成功,但到底市场在哪里?除了曙光,谁是买家?

我个人目前持谨慎乐观的态度。
# Setev 于 2009-06-02 8:35 am edit

呵呵,龙芯!又是一个打着民族旗号的产品。大跃进式的工作方式。

掂量出自己的分量,给自己合理的定位应该是做事情的首要解决的。难道像大跃进,喊亩产万斤,难道你的一亩山坡地就真能出产5000斤了?

我倒是佩服珠海炬力这个公司。
# whoknows 于 2009-06-02 8:41 am edit

cavium下一代的处理器是65nm,这是他们致命缺陷。从投资角度来说,合并后的netlogic/rmi都
比各自更为强大,但是对rmi员工来说,这次贱卖
确实太惨了,意味着几年的辛苦都白费了
# Panabit 于 2009-06-02 8:53 am edit

我相信通过这件事情,那些一心绑定在RMI或者CAVIUM上开发自己产品的二三线网络安全厂家就要仔细考虑了,这样的风险是否是自己可以承受的,也许,X86会重新抬头。
# 陈怀临 于 2009-06-02 8:57 am edit

我同意Panabit的观点。特别是Intel的最新微结构Nehalem之后,x86确实很好的架构了。
# 老韩 于 2009-06-02 9:10 am edit

我还是不看好Cavium,他们和XLP对应的处理器最快也得明年才能出来吧。通过RMI这件事情,会有很多人发现,X86可能更可靠(综合);同样,也会有人意识到自主知识产权处理器的重要。
# whoknows 于 2009-06-02 2:01 pm edit

hw,zte他们非常欢迎这次合并,这对他们是有好处的,因而,这次合并对cavium非常不利。在电信设备/网络设备市场,x86架构未来几年之内都没有机会。从接口丰富程度,从功耗来说,x86都相差太远太远。
# 陈怀临 于 2009-06-02 2:06 pm edit

whoknows应该改成Iknow。连华为与中兴很high这次合并都知道:)。圈内人呀。希望多让华为或者中兴的弟兄们访问弯曲评论:-)
# youdontknows 于 2009-06-02 6:31 pm edit

我怎么听说很多华为的人已经开始唱衰这次贱卖了,而且听说RMI的很多员工已经开始跑路了,真是树倒猢狲散啊
# Panabit 于 2009-06-02 7:00 pm edit

就目前的技术层面而言,除了通用处理器是国内掣肘外,其它像POE或者局部加速的技术,国内都可以实现,因此,完全可以利用我们自身的技术,再加上X86等功能强的CPU来做一个系统。可以利用X86换掉RMI或CAVIUM的MIPS CORE。功耗方面,在高端系统,X86没有明显的劣势。至于你所说的接口丰富等方面,完全可以有外围硬件替代。另外,从长远角度看,对数据包做更高层次的检测室大势所趋,所以,数据包都经过通用CPU,而不是目前的防火墙所简单的SLOW/FAST模型,这也意味着需要功能更强的通用CPU来实现。还有,目前X86的外围网卡和芯片组已经做了很多方面的工作,比如Intel宣称的IOAT技术,就已经在网卡里增加了RSS来作为LOAD BALANCE,增加了DCA技术来将数据包DMA到内存的同时,加载到CACHE里,这些都是可以显著增强数据包处理性能的特性。
# Idontknowtoo 于 2009-06-02 7:01 pm edit

哪那些绑定在多核上的topsec,leadsec不变得前途未卜了啊?
# Panabit 于 2009-06-02 7:19 pm edit

HW,ZTE欢迎这次合作,这不太可能吧,这哪是一个积极信号,看看CISCO同这些公司的关系,难道不心存忧虑?我倒是觉得将这看着一个警钟比较好。至于国内那些将自己的全部产品线押宝在CAVIUM上的,就更加要注意了。CPU,还真是国之重器呀!
# whoknows 于 2009-06-02 8:42 pm edit

Panabit 没有真正去了解过电信网络设备领域这个行业,还在用PC领域的眼光去看问题。SOC为什么可以在网络设备大兴其道,整板成本是关键:不光是外围器件的数量可以上,加上PCB布线生产加工的难度降低。 btw,你说的intel哪些功能,cavium/rmi/freescale的芯片上都已经有了,而且在市场上卖的产品都用上了,不仅仅是一个概念而已。
# whoknows 于 2009-06-02 8:46 pm edit

员工跑路是可能的,但是,对于电信设备制造商来说,对他们是利好而不是利空。NETLOGIC在国内的业务最主要就是hw/zte,他们需要大量使用tcam+多核处理器的方案,两个公司合并以后,可以给他们提供更好的解决方案和参考设计。
# whoknows 于 2009-06-02 8:50 pm edit

功耗方面,在电信设备上的CPU是不能有风扇的。就一点你就想想跟x86架构功耗差别有多大。何况cavium/rmi都是soc,里面还集成了很多其他的接口和引擎,整版功耗比x86方案不只少一点两点
# whitebird 于 2009-06-02 9:04 pm edit

对于 OEM 厂商来说,应该是利好。说明 RMI 稳定了。

对于 RMI 员工来说,不做评论。一切皆有可能。

RMI 的技术值得尊重
# PM 于 2009-06-02 9:13 pm edit

现在那个电信厂家还在使用x86平台?
本人做了8年核心网,RNC和接入网,从TI/DSP+ Intel/NP,到今天到muti-core,还从来没有使用过x86,从前不会,现在不会,将来也不会选择x86。

但是听说Z公司核心网使用的是x86,但我们从来不用x86,x86适合PC但不是和嵌入式这个领域。

x86好好做pc吧!

RMI不知后续如何?XLR/XLS不以后知是否还能像今天这样风光!
# 陈怀临 于 2009-06-02 9:24 pm edit

很热闹。我问一个问题。为什么?

1.为什么x86更适合于PC和Server?
2.为什么MIPS和PowerPC更多用在通信?
3.为什么ARM更多用在移动设备handheld?

我个人认为我能回答2,3.但不能回答1说服我自己YET。
# PMP 于 2009-06-02 9:27 pm edit

现在那个电信厂家还在使用x86平台?
————
Juniper的路由器都有x86系统做Routing Engine
:)
# puzzled 于 2009-06-02 9:31 pm edit

.为什么x86更适合于PC和Server?
2.为什么MIPS和PowerPC更多用在通信?
3.为什么ARM更多用在移动设备handheld?

还请说说看
# Panabit 于 2009-06-02 9:32 pm edit

各位千万别误会,我并没有说X86用在电信核心网。我主要是针对国内现在的二三线网络安全厂家所做的评论。另外,Juniper等已经在走通用处理器 + ASIC的模式了,只不过用的不是X86,而是PPC等。另外,要以发展的观点看待问题。X86现在的架构已经解决了IO问题,这正式发展自己的外围 ASIC的好时机。
# 帅云霓 于 2009-06-02 9:34 pm edit

试回答陈首席的三个问题:
1:X86在PC和Server行业的地位,是历史形成的。最初业界IBM和Intel的联盟造成了这个现状。Intel的X86系统,及当时操作系统DOS是开放的,因此聚敛了很高的人气。
2:MIPS和PPC属于RISC架构,性能可以做得很高,因此在专用系统中比较好用。另外MIPS属于大端(Big Endian),与网络字节序相同,减少了转换字节序的开销。
3:ARM处理器可以做的功耗很低,很精简,因此适合没有固定电源,使用电池供电的移动设备。

不妥之处还望各位大侠指正。
# 陈怀临 于 2009-06-02 9:47 pm edit

我期待大家的讨论。我看一下大家的讨论。对Panabit对系统的理解比较欣赏。能说出x86解决了I/O问题这句话,说明确实有点功力:–)。是个搞技术的好苗子。也希望其他华为的同学们看看Nehalem的介绍。

当然,并不是说Nehalem微结构可以做NS5000E的Forwarding了。只是说,事情都在悄悄地演变着。。。。。。
# puzzled 于 2009-06-02 10:01 pm edit

首席对 Netronome的NFP32XX,EZchip的NP3,以及多核,有没有相关的比较,比如针对路由器这种应用,谢谢
# 帅云霓 于 2009-06-02 10:09 pm edit

X86的IO问题,我觉得根源在其体系结构,X86属于CISC,但演进到P3/P4时代实际上用RISC+微码来实现,这样造成内部晶体管数目和面积膨胀,放不下更多的I/O附件。(不能和RMI那样的SoC比啊)
因此,X86的I/O就要受外部总线的吞吐量限制了。最初是PCI,为解决这个问题又发明了PCI-X和AGP技术,但仍然是瓶颈。PCI-E出现以后好了一些,但是和RMI之类的处理器的内部IO互联、FMN还是不能相比。
如果Intel真的解决了这个问题,不清楚这种处理器功耗该有多大,价格该有多高?
# 帅云霓 于 2009-06-02 10:13 pm edit

补充上面的:
如果,市面上出现了某种x86架构的多核处理器,具有强大计算能力同时,也集成了很多IO部件,性能可能优于RMI/Cavium,但由于成本、采购量等各种原因,其性价比一直低于MIPS/PPC的多核处理器,那么,在市场上Survive也是有难度的。
这里面还是用户需求的问题。光具备超强的技术/性能,傻快傻快/傻多傻多,而不能抓住用户需求,那么只可能是业界的流星。
# matrix 于 2009-06-02 10:15 pm edit

“x86解决了I/O问题这句话,说明确实有点功力:–)”
===呵呵,首席也没有必要这样损人吧?x86 IO扩展能力问题由来已久,路人皆知,了解这个问题需要功力?
新进的PCIE算是很大程度上解决了这个问题,但是PCIE在Qos方面(通道化等等)还是有瓶颈,还有一段路要走。
===
x86作为route engine没有问题,计算能力强,但是也就说明了控制平面的可行性。

===
1.x86以前没有soc方案,需要外挂桥片,这个对成本和pcb设计是一个问题(特别是中低端方案,对价格敏感)。当然去年intel也出了一个soc的片子,还集成了安全加速引擎和低速遗留接口的支持(T1,E1),说明Intel又有做通信的想法了。

2.x86平台的功耗问题,一直让人头疼。高端的至强平台,功耗到100w+,客户单板设计相当头疼。不说100w+,就是50w,现有客户都抱怨不断!
# manofsteel 于 2009-06-02 10:16 pm edit

RMI是一家技术导向型公司,从多线程到现在的4 issue等都体现了追求技术决心,但其在芯片内部实现了这些东西固然有其好处,但是考虑一下功耗,成本,据了解RMI给客户的芯片都是LP版本的,die size都很大,成本相对都比较高。

公司毕竟是商业的,完全追求技术路线的公司很难取得最后的成功。这方面,感觉RMI输给CAvium。
# matrix 于 2009-06-02 10:17 pm edit

再论功耗问题,freescale一个宣传策略:30w功耗作为嵌入平台功耗的分界线。肯定是有一定道理滴
# 丘子隽 于 2009-06-02 11:01 pm edit

有没有介绍下Freescale的PowerPC平台特点的
# Panabit 于 2009-06-02 11:54 pm edit

想不到我关于X86的一序话居然是丢下了一颗炸弹,呵呵。
# kkk 于 2009-06-03 12:06 am edit

intel Ep80579
# guest 于 2009-06-03 12:27 am edit

二三线网络安全厂商也会转RISC平台。台湾传统工控板厂商都在积极开发和推行cavium/rmi的中低端的标准板。x86平台在网络设备上的可应用范围会越来越窄。 网络设备这个行业的生态跟传统的pc/server 完全不一样。
# hope 于 2009-06-03 3:04 am edit

看了很多评论,发现很多人的理解还是很肤浅.X86有它的优势也有缺点.至少在通信领域,嵌入式以MIPS和PPC为架构的多核处理器还是主流,这里有很多原因,功耗,BOM成本,IO接口,IO处理的能力,多核配套软硬件环境,IO处理能力,任何一样,X86目前都没有优势,X86的计算性能,我做过和 RMI,OCTEON对比,基本上如果同主频,OCTEON的CORE和X86一致,RMI的CORE设计相对性能较差(10级流水线,单 issue).RMI的下一代,应该讲从路标的角度讲,要比OCTEON的下一代更吸引人,多issue,多线程,加入类似OCTEON硬件保续单元等等,基本上在保留自身特点的基础上把原先OCTEON的优点都抄袭下来了.就是具体的流片时间要人担心,另外功耗也是一个主要的问题,而OCTEON的下一代相对应该更可靠,基本上只是升级工艺,更多的内核而已.现在市场上,不是你画个图给大家就可以,推出的时间点,稳定性都很重要.目前从纯计算的角度讲,如论是RMI还是CAVIUM,相对于X86也并不吃亏.
# KISS 于 2009-06-03 5:57 am edit

1,这个价格是不是贱卖不一定,现在的形势太差了,IPO基本无望,投资者退出无门,合并是一个不错的选择。合并(Merge)后如果整合成功,RMI的前途或许更光明,至少投资者看好-$NETL随着消息的宣布上涨10%+, $CAVM这两天倒是在跌。同样是上周,另一家MIPS厂商SiCortex,虽然增长势头很猛(HPC市场)-但没有新的投资进来,不得不宣布变卖资产,停止运营了。

2, x86在通信市场的看点不是Nehalem,而是将来基于Atom的SOC。上面kkk提到了Intel去年发布的EP80579,这个是Atom之前的产品,基于Pentium M “Dothan”内核的单核SoC,这个芯片TDP在11w-21w之间,90nm工艺,主频600M-1.2G,集成度丝毫也不亚于其他通信处理器。采用Atom之后,只怕每个通信处理器厂商都得紧张一下了。Intel的优势实在太多了-制造,研发力量,以及x86的低成本,但能否在通信市场成功还得看商务(business)方面的因素。

3, US半导体初创公司的美好时光已经一去永不复返了,尤其是处理器公司,再也不要想有QED那种几十亿美金的收购案了。希望在东方……:)

结论: no idea on RMI, long Intel. My two cents

To Panabit:
为什么说通用处理器是国内OEM的瓶颈,从MIPS授权IP受出口限制吗?比如最高端的MIPS 1004K。当然,即使有核,到SoC/系统也有很多工程困难。
x86的I/O问题是个什么问题?是指FSB?PCI-E等也只属于系统结构层次吧,跟ISA是不是x86没关系.
# KISS 于 2009-06-03 5:58 am edit

ft
为什么Natal的评论需要被审核?
# 陈怀临 于 2009-06-03 6:08 am edit

系统的AI智能决定是否审核:-)。可见机器人永远不能战胜人。
# KISS.曹操 于 2009-06-03 6:15 am edit

tektalk明天也系统维护吧。
好像凡是明天不处于技术维护状态的网站,都属于不怎么样的网站 :)
# guest 于 2009-06-03 7:36 am edit

atom性能太差,而且intel都将其生产外包给台积电,可见其在intel中的地位。 intel在通信市场近期难有作为,即便是传统的防火墙厂商(topsec/网御/网神),他们也都认识到了这个问题,正在积极转型。
# 老韩 于 2009-06-03 8:16 am edit

EP80579是比较失败的产品,自身不过硬,又在错误的时间出现,天时地利人和都不占便宜,据说到现在几乎没有国内安全厂商采用。平心而论,我认为那个平台还是不错的。
# matrix 于 2009-06-03 6:41 pm edit

“x86的I/O问题是个什么问题?是指FSB?PCI-E等也只属于系统结构层次吧,跟ISA是不是x86没关系.”
===显然,上述讨论不是讨论ISA之间优劣。
这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子,FSL ppc产品线.

KISS大大,对于以高集成度为卖点的SoC来说,难道我们只会关注它说采用的ISA?
# aaa 于 2009-06-03 7:20 pm edit

看看这些
Netlogic <—RMI
Netronome <— Intel IXP
IDT <— Tundra

寒冬呀,日子不好过。
个人不看好RMI, Netronome,小厂家。
做方案还是用大厂家的多核吧.
# Panabit 于 2009-06-03 7:58 pm edit

我觉得,从RMI被贱卖这件事情,看到的不是对谁有利亦或不利,而是一个信号,就是一个我们产品所依赖的第三方是否稳定的信号。我们可以想一想,如果当自己的产品线全部采用RMI或者CAVIUM的时候,一旦出现不稳定的信号,自己是否可以承受。当然这个能否承受与否,是因公司而异的。我并不是竭力推荐 X86,我只是说,X86同以前相比,已经有了很多积极的变化,而且这种变化还在持续下去,比如最新出现的i7,其QPI,总线方面,PCIE 2.0的支持已经多通道内存的支持,这些都是积极的变化。从CPU的角度看,X86无疑是强劲的,当然接口肯定不能同通信处理器相比。不过我认为,如果厂家自己有能力丰富接口而弥补这些不足,X86倒不失为中高(高-)端安全产品一个较好的选择。现在的安全产品有一个趋势是朝应用层发展,这也对更多的 CPU处理能力提出了要求,X86在这方面无疑是有优势的。至于matrix兄,陈首席可不是在损我,你要相信这一点,呵呵。大家都在以自己的经验去看待事情,有时不妨适当跳出一下自己的圈子,呵呵。
# Panabit 于 2009-06-03 8:12 pm edit

回KISS兄弟,我说的X86 IO问题主要是指:
1)内存带宽和CPU之间的扩展性
2)CPU和外部设备之间的连接扩展性
早期大家也知道,通过FSB和北桥,内存带宽不具备同CPU同步的扩展性(当然现在也不是100%同步,但是已经是一个极大的变化了)。至于2)QPI和PCIE虽然不是那么完美,但是至少已经足以对付相当大的IO带宽要求了。
还有一个积极的变化是,IOAT。我觉得IOAT中最值得欣赏的特性是DCA(Direct Cache Access),这个特性用的得好,对小包的吞吐会有相当大的贡献量。其它的特性如RSS,如果自己做外围ASIC或FPGA的话,完全可以自由发挥,倒没有DCA那么明显了。
# guest 于 2009-06-03 8:25 pm edit

说实在的,个人感觉panabit兄对cavium/rmi/freescale的芯片不是很了解,甚至对x86也不是很了解,所以才不能正确去比较它们的优势和劣势。感觉你是在安全行业,但是对安全产品的硬件方面,也不是太了解,所以,觉得很多看法感觉只是隔靴搔痒,说不到点子上。x86在安全产品有市场,完全是历史的原因,现在这个市场正在远离它。随着安全厂商的成熟,他们有能力去构建自己的软件平台的时候,基于非x86平台的解决方案会占越来越多的份额。就拿高端来说,用 risc加内容过滤芯片的组合,性能上会比x86 纯软件的方案会强很多。 拿 I/O 说,pcie总线由于协议复杂,有效数据的吞吐量只有理论值50%左右。这个对于高端系统会成为吞吐的瓶颈。

当然,最终的胜者还是要靠市场来决定,就像当年HT/PCIE之争,rambus/ddr之争,最终胜出的不是性能最好的,而是市场能接受最快的。
# matrix 于 2009-06-03 8:26 pm edit

panabit兄,供应商的稳定性问题,肯定是设备商最关心的问题。当年H3C在greenfield上栽了大跟斗,所以HW,ZTE等大客户在风险控制方面的经验肯定多多。

btw,我们也要破除供应商就一定是大厂商的迷思。Intel不是也把IXP系列给倒手了吗?对于像Intel这样大恐龙,瞧得上通信处理器(甚至是通信多核处理器)这个细分市场吗?
退一步说即便是Intel重新玩通信处理器这个市场,Intel这个级别的公司,按照它的运营模式一定能够在这个细分市场赚得盆满钵盈吗?

startup在创新肯定有可取之处,否则在美国这个充分竞争市场,根本就没有存在的必要。

其实这方面可以学习cisco,对于有价值的startup加以收购(当然,这个又要考虑米国政府同意与否了)。
# guest 于 2009-06-03 8:29 pm edit

panabit 兄,我觉得你需要认真研究一下cavium/rmi的芯片再来讨论会更有意义些,因为我感觉你似乎完全不了解他们。如果我说错了,请见谅
# matrix 于 2009-06-03 8:41 pm edit

“拿 I/O 说,pcie总线由于协议复杂,有效数据的吞吐量只有理论值50%左右。这个对于高端系统会成为吞吐的瓶颈”
===guest兄,吞吐真还不是大问题。pcie 2.0 5Gbps per lane,multi-lanes问题不大。再说传说中的pcie 3.0,8-10Gbps per lane,就更不是问题。

pcie的问题还是Qos,通道化支持channelization suppport),flow control弱。作为packet interface,先天不足,不能和SPI4 Interlaken接口pk。
# 陈怀临 于 2009-06-03 8:43 pm edit

行,文人相轻的老毛病快要出来了。其实,技术观点通常都是各有道理。这与个人的经历有关。所以不要勉强。互相学习才是王道:-)。
我现在有个好的习惯。我特别讨厌开会。但只要我去参加一个会,我事先会想尽方法告诉自己我要学到点东西。否则,我参加会议是受罪:-)

关于Matrix的“其实这方面可以学习cisco,对于有价值的startup加以收购(当然,这个又要考虑米国政府同意与否了)。”。如果您阅读我这些年关于华为的文章,其实是在劝他们在技术上做好准备,购买公司,扩展起来。

华为目前山头林立。藩王遍地。而且许多人极端自信。认为什么都可以和应该自己做。

我拭目以待。
# Panabit 于 2009-06-03 8:43 pm edit

会58楼:
guest,谢谢你善意的提醒。Cavium和RMI的东西,我很早就有研究过了。当时国外一家公司在国内的Cavium性能验证工作也是我做的(当初是CN38XXX刚出来的时候)。关于它的那个POE改成SSO这个名称,我也知道其为什么改的,呵呵。
# 陈怀临 于 2009-06-03 8:51 pm edit

这篇文章本身一般,就是报道一个业界收购。但引发的讨论相当优秀。基本上涉及到了目前通信业界的精华。而且人员参与感觉来自各大通信公司的骨干人员。我自己也学习到了许多东西。我会把这篇文章标注为“弯曲推荐”。
# matrix 于 2009-06-03 9:16 pm edit

Panabit 兄,”我觉得IOAT中最值得欣赏的特性是DCA(Direct Cache Access),这个特性用的得好”

===
Intel的DCA特性不清楚,DCA哪年推出不知道。
但是这个玩意不是新东东。RMI XLR推出之时,就有一个L2 cache Allocate功能,报文DMA到内存的同时,可以把报文同步搬运到L2 cache,后续软件处理可以有效减少cache miss rate,从而提高性能。

注意这玩意XLR一直都有,XLR是多少年前的产品了?
# Panabit 于 2009-06-03 9:25 pm edit

Matrix 兄,你说得很对,的确是这样的。正是由于这些,所以我说X86正在发生积极的变化。IOAT的推出我想有3年左右吧(所以应该比XLR晚一些,至于 DCA,应该是07年出来的,是IOAT2中的内容,所以就更晚了)。另外,据我所知,XLR刚开始推出的时候,是将小于112 Bytes的包放在内存中,所以当时Cavium在这方面的测试结果要差于RMI。后来Cavium也做了这一点(但是好像是98 Bytes以下的报文,这两个数字我需要再考证一下)。Intel的这个DCA特性强在什么地方,就是它拥有相比CAVIUM或者RMI大得多的L2和 L3 CACHE,所以能够同步更多的报文。
# matrix 于 2009-06-03 9:41 pm edit

Panabit兄,你对RMI packet L2 cache allocate功能理解有误。

它有一个寄存器,可以控制报文头部多少字节同步搬运到L2 cache。比如说,设置寄存器为0xf,则搬运packet header 15个cacheline(32 byte)= 480字节进入L2 cache。

报文整体都在内存中,但是报文头在cache,而一般报文处理显然处理报文头的几率大得多!
# aaa 于 2009-06-03 9:43 pm edit

DCA?
Freescale叫它为cache stash.
从MPC8560, 03年就有了。
到了P4080,都能stash到指定的L1, L2, L3 cache。
# aaa 于 2009-06-03 9:45 pm edit

还是matrix是行家里手
# Panabit 于 2009-06-03 9:50 pm edit

Matrix 兄,“报文整体都在内存中,但是报文头在cache,而一般报文处理显然处理报文头的几率大得多”,我赞成你的观点。可以控制SIZE的特性是刚开始就有的吗?这是一个非常好的特性,Intel的DCA目前还缺乏这方面的东西,或者说目前支持IOAT的网卡或其它外围设备还不支持这个可控SIZE的特性。另外我想再阐述的是,我的观点并不是否定或完全肯定任何一种架构,我的核心观点是,当我们一直对某个东西熟悉,并心里否定另外一个东西的同时,不妨想一想,“我这样对不对?”。另外,架构的选择也同自己面向的领域和产品形态息息相关(当然这都是废话了,呵呵)。通过X86这个“炸弹”,我学到了很多东西,也希望弯曲评论越办越好!:)
# matrix 于 2009-06-03 9:54 pm edit

aaa兄,P4080 宣传今年Q2样片。现在能够sample了吗?

FSL通信处理器老大哥做惯了,市场需求反应有些迟钝呀。
# Panabit 于 2009-06-03 9:55 pm edit

Matrix 兄,“报文整体都在内存中,但是报文头在cache,而一般报文处理显然处理报文头的几率大得多!”,我非常赞同你的这个观点。另外,XLR的这个控制 SIZE的寄存器是一直就有的吗?这个特性是非常有用的,它可以让你在CACHE POLUTION和性能之间自己来做平衡。Intel的DCA,或者支持DCA的网卡或其它设备缺乏这种特性。
# Panabit 于 2009-06-03 10:09 pm edit

Matrix兄,有兴趣的话,私聊一下,我的MSN: softmic_msn@hotmail.com。
# Panabit 于 2009-06-03 10:11 pm edit

感谢弯曲评论这个平台,让我认识到这么多高手,衷心祝愿弯曲评论越办越好!!!
# aaa 于 2009-06-03 10:16 pm edit

matrix兄,有同感。
FSL确实是有点钝。
这不,被Cavium和RMI的多核逼上梁山。
# gg99 于 2009-06-04 1:12 am edit

问陈首席的问题,貌似netlogic买断rim是为了增强其 multicore processor+tcam业务,这个业务与np+tcam在交换路由或者其它领域会有冲突吗,国内的厂家像HW,ZTE,DATANG,H3C现在用的主要是cavium还是rim为主(与tcam结合的部分)?
# Racoon 于 2009-06-04 5:38 am edit

前面Matrix兄和Panabit兄提到RMI packet L2 cache allocate功能,确实可以通过配置将部分报文直接放到L2 cache里,但问题是此时报文还没进入CPU内部进行处理,仍然积压在其硬件加速单元里。大量尚未开始处理的报文占用L2 cache,必然会导致正在处理的报文出现cache miss的可能性增大,对性能也没有好处。
当然在流量较低时,使用这个特性可以降低单个报文的处理周期。
所以个人感觉这个功能没啥用,呵呵
# KISS.曹操 于 2009-06-04 6:00 am edit

@老韩: EP80579确实算是比较初级的SoC产品-只是把传统的Core+北桥+南桥+加速器做到一个die上,感觉并没太多系统级优化,例如互联设计等。

你说的失败的地方主要是哪里?芯片指标不过关,还是软件栈支持不好,或是系统开发方面?
—————————————-
老韩 于 2009-06-03 8:16 am
EP80579是比较失败的产品,自身不过硬,又在错误的时间出现,天时地利人和都不占便宜,据说到现在几乎没有国内安全厂商采用。平心而论,我认为那个平台还是不错的。
# Panabit 于 2009-06-04 6:07 am edit

Racoon兄,你说得对,会有这样的问题的,所以那个可配置的SIZE寄存器是一个很好的特性。这个对小包的贡献还是挺大的,X86的CACHE比较大,也会好一些。
# Panabit 于 2009-06-04 6:09 am edit

Racoon兄,你说得很对,的确有这样的问题,这实际上是对CACHE产生的POLLUTION了。所以那个可配置SIZE的寄存器就很重要。这个特性对小包的贡献是蛮大的。特别是在做性能测试的时候,呵呵。
# KISS.曹操 于 2009-06-04 6:10 am edit

@matrix大大
隔行如隔山啊,术语涵义不同,看到x86的第一反应就是ISA,不是系统,呵呵
—————————————-
matrix 于 2009-06-03 6:41 pm
这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子,FSL ppc产品线.
KISS大大,对于以高集成度为卖点的SoC来说,难道我们只会关注它说采用的ISA?
# KISS.曹操 于 2009-06-04 6:11 am edit

顺便搭车问各位大大几个问题:
1,从OEM系统用户角度看,FSL的e500比e600的优势有哪些,对于通信应用来说?
2,FSL的e700是不是取消开发了?QorIQ的roadmap里有没非e500的产品?
# 老韩 于 2009-06-04 7:03 am edit

EP80579,简而言之就是性价比不高。我一开始觉得最有可能的应用是SMB级的存储,Netgear,Linksys之流可能感兴趣,可一直没有看到。

Intel现在已经把80579边缘化了,后期传说中加入IXP RISC核的计划也停了,现在推的是Atom和ce600/1G。
# 陈怀临 于 2009-06-04 7:07 am edit

得,Intel买断Windriver。x86进入什么市场?嵌入式:-)
# matrix 于 2009-06-04 7:31 am edit

今天简直太匪夷所思—Intel 收购windriver

难道intel要大举进入嵌入处理器市场(通信处理器算是其中的细分市场)?

难道要首先收购windriver,给powerpc和mips一个下马威?

服了,真是混乱年代,必须神经彪悍!
# cl 于 2009-06-04 7:42 am edit

我期待大家的讨论。我看一下大家的讨论。对Panabit对系统的理解比较欣赏。能说出x86解决了I/O问题这句话,说明确实有点功力:–)。是个搞技术的好苗子。也希望其他华为的同学们看看Nehalem的介绍。

当然,并不是说Nehalem微结构可以做NS5000E的Forwarding了。只是说,事情都在悄悄地演变着。。。。。。
————————–

1,字节序
2,x86作为通用处理器。架构优先考虑内存带宽。IO性能差,接口不够丰富。总体价格高。通信处理器瓶颈不在计算能力。
3,不过freescale继续熊下去,相信不远ppc就会被x86和mips消灭掉。。。
# 秋风 于 2009-06-04 8:53 am edit

这两天还在与windriver的人交流Wind River Test Management。我还说难道Wind River也要学Thoughtworks做咨询公司了。不想晚上就看到被Intel收购的消息。
世界变化之快,真是 太刺激了。
# aaa 于 2009-06-04 2:17 pm edit

Intel想干嘛?
一统天下?干掉arm/ppc/mips?
# 陈怀临 于 2009-06-04 2:25 pm edit

不知与ATOM芯片的长期发展是否有关系。反正,加强软件力量,获得一大批已经存在的客户account意思是事实了。换言之,华为的VRP vxworks是捏在Intel的手上了。咔咔:-)
# aaa 于 2009-06-04 2:34 pm edit

这桩收购,带来很多变数.
投奔QNX?
# aaa 于 2009-06-04 2:40 pm edit

Freescale这下该找谁(montavisa, Green Hills, QNX???)来支持它的芯片?

Cavium还有Netlogic(RMI)它们该如何面对呢?
# 5np4g.powerpc 于 2009-06-04 5:20 pm edit

montavisa我记得好像是Intel是背后最大支持者,powerpc这几年确实有些没落了。。。
# anonymous 于 2009-06-04 5:58 pm edit

华为对intel的芯片很清楚的,有专门的团队在研究,intel也有一个专门团队跟华为负责接口。而且,华为内部也作了intel的刀片,跑suse linux, 供内部使用,以及搭售服务器的时候顺带卖卖。

做设备厂商,性能不是最重要(能满足市场规格就可以),整板,整框设备成本能降下来才最重要。买一个设备挣一笔钱,在选型的时候,某个方案可能因为多一个FPGA片子都可能会导致出局。所以,intel不做soc,基本上没有可能能赢通信市场。
不过,收购windriver,倒是增加了很多变数。
# anonymous 于 2009-06-04 6:10 pm edit

VRP 只是数通的软件平台。其他产品线不是基于这个。更底层的是Dopra。不过,hw所有的东西都是工程化很好: 模型简单,上手快(新员工能很快干活),调式手段丰富(出了问题可以有很多追踪/排查手段,这个很对工程化及其重要)。但是,从纯软件设计角度看,结构很差,很混乱,效率/性能也是非常低。
# hope 于 2009-06-05 2:22 am edit

1. X86的对于嵌入式系统来讲,是综合性的欠佳,不是单一的某个方面.比如讲功耗,有人说ATOM的功耗很低,可是你仔细看下ATOM的功耗低是只它这颗芯片的功耗,没有包涵外部的桥芯片等等.而现在的嵌入式系统都是SOC,我们讲RMI还是OCTEON,这些芯片是都是直接出几十G的外围接口,在看看通信设备的需求,有XAUI/PCIE/SERDES等等不同的接口,但是X86就需要挂桥,还是桥,这个整板的功耗是多少?这个成本又变成多少.所以大家看问题要站在系统设计的角度去看,而不是只是单纯的从一颗CPU,单纯的看它的CACHE有多大,主频有多高.真正有系统设计经验,熟悉多核的架构师,应该会明白我的意思.而不是只是简单的测试一下.
2. 至于安全厂商大量应用X86架构是有历史原因的.而且目前众多的安全厂商正在转入MIPS多核领域.
3. 目前对于华为这类通信厂商,其平台软件是综合支持各类体系的CPU,无论你是MIPS还是X86,这个无论哪家厂商出问题,华为收到的影响有,单不是绝对的,只要软件适应多核架构,有被选的方案,并不是主要问题.RMI被收购,其实从可靠性来讲,倒是更好了,要不作为私有股权,RMI就像是一颗炸弹,这回加入NETLOGIC,反而应该会有更好的发展,倒是CAVIUM面临的竞争会更激烈,因为相对来讲CAVIUM芯片从将来讲,可能整合性会弱于RMI. 比如RMI+TCAM?一切皆有可能
4. 风河也被收购了,又一颗炸弹.大家都能看到上网本的火爆,导致了嵌入式超便携系统的可能,而这个系统,intel还是微软都没有绝对的把握,所以收购风河,加强自己的软件能力,也许有一天intel会收购CAVIUM,who knows.
# KISS 于 2009-06-05 11:35 am edit

@hope:
1,你可以用Intel EP80579和Cavium CN52xx或PQ III MPC854x做一个详细的比较-外围接口,价格。另外,Atom的设计功耗是Dothan的1/10,相信基于Atom的SoC也会解决SoC的架构问题。或许x86作为通信处理器的最大障碍是software stack支持的问题,性能scaling对于Intel来说不是问题-只是来自非系统工程师的看法。
2,IMHO,Intel绝对不会收购non-x86的半导体公司了-肯定也不会收购AMD :) 我觉得XScale/IXP的出售都说明了他对x86的信心。
# 随便扯两句 于 2009-06-05 7:21 pm edit

@kiss
Tolapai平台在国内已经发布快一年,跟intel一贯的做事风格类似,发布时就已经携带了很多合作伙伴做好的应用来展示,基本上是已经成型的产品。但是,目前市场上用于这个平台的产品并不多,在二三线安全厂商有一些产品,不过也不知道市场卖的如何。Tolapai的双核版本好像还没有发布。至少目前从市场看,Tolapai还不能说有多大成功。

和你的观点恰恰相反,如果x86是software stack的问题,intel很容易去解决。想当年IXP多么庞大的软件库,intel都做得非常好,所有通信厂商都对此赞不绝口。我以为还是和硬件/系统设计相关部分的才是目前x86的弱点。

Xscale/IXP出售不是对x86的信心,而是迫于无奈:看不到获胜的前景。在出售他们之后很长一段时间内,直到现在,intel对于如何重新进入这一市场没有明确路线图。

而当初intel进入NP市场,软件/硬件/文档/客户培训都是做的非常到位,所以很快能把其他家NP拉在身后。
# ALL IP? 于 2009-06-05 8:14 pm edit

很热闹,在下也来班门弄斧一把。

X86当前来看在通信领域的应用作为控制面比较合适,而且是在对CPU性能要求比较高的控制面应用,以及对高层业务处理比较多的特定领域,例如DPI。

Intel在Embedded领域是有大的动作,X86也在向SOC方向发展,但其主要基于PC应用的视角设计的处理器确实不适合作为数据转发应用,个人判断未来几年内Intel的X86处理器在转发领域难有所作为。如果Intel确实想进入这一块市场,只能通过收购一家合适的公司,靠自己的得看 3-5后的X86新架构如何做了
# ALL IP? 于 2009-06-05 8:25 pm edit

Intel 收购WindRiver的影响估计通信业界都会在看,看Intel的后续策略,如果其能保持原有的第三方态度,能够很好的支持PPC/MIPS的后续发展的话,Vxworks在通信领域会得到继续的发展。但这点很难,这和intel想在Embedded领域大展拳脚是冲突的。

linux和FreeBSD之类的软件可能会对此次并购持欢迎态度。相信有长远目标的公司对是否继续使用vxworks会进行深入的评估,很可能会转型,因为PPC/MIPS的新一代处理器如果Intel不支持,其后续的产品是没有发展的。
# ALL IP? 于 2009-06-05 8:35 pm edit

X86在数据面的应用,先不考虑其性能如何,首先产品的系统方案就会很复杂,需要配合大量的外围芯片,硬件综合成本非常高,工程实现也是一个很大的挑战。
# KISS 于 2009-06-05 8:39 pm edit

@随便扯两句:
thanks for your information
我想问个问题,如果Software stack等等不是问题的话,Tolapai(1088-FCBGA)的封装-比CN52xx(729-BGA)和PQ III(783 FC-PBGA)多了300+个pin-对系统设计的芯片选型大概有多大影响? 是不是对board cost/reliability等等方面来说。

顺便请教一下各位大大:一般来说本土厂商系统工程师选择芯片大概是个什么样的优先级?
# ALL IP? 于 2009-06-05 8:48 pm edit

RMI要被卖掉在圈子里面已经流传了很久,应该是一个半公开的秘密,可能最大的秘密就是谁来接盘了,没想到突然爆出Netlogic来。

TCAM由于其优异的查找性能在转发领域的贡献是有目共睹的。由于TCAM的功耗与其容量基本是线性增加,随着路由表和转发表越来越大,在核心路由器领域,TCAM的容量问题已经成为转发表的一个瓶颈。

在中低端领域,10G以下处理能力的设备,低成本的解决方案还是比较多的,RMI的竞争力并不是很明显。

如果如前面的大侠所评论的那样,Netlogic希望通过收购RMI来增强其TCAM的竞争力,用处多大实在难说。一句话,Netlogic收购RMI的效果有待继续观察。
# ALL IP? 于 2009-06-05 9:01 pm edit

根据个人的经验,大厂是不能迷信的,这年头,挂羊头卖狗肉的多去了。观察某个产品的长远发展要看这个产品在其公司的地位,只有其核心产品的保障性才强一些,外围产品特别是跟风想赚一把的,前景都不太美妙。

IBM实力强吧,但因为NP得市场对于IBM来说实在太小了,发展又要投入很强大的力量,最终还是放弃了。

Intel更是前科不少,在光通信一片火热的岁月,Intel也毫不犹豫的进入,收购一些公司,不知道有没有听说过Intel的10G光收发模块,但现在早就解散了,其相关的IC业务也卖完了。还有IXP的例子,前面的大大已经说了不少。
# ALL IP? 于 2009-06-05 9:20 pm edit

Cavium在下一代多核的进展上好像碰到困难,其路标已经再三推迟。。。Cavium在这个领域能走多远,也许很大程度上就决定于其下一代多核的成败上面。

Freescal在多核上反应比较慢,不过终于还是反应过来了,不管是CORE还是芯片规划,在后续的发展上有着相对清晰的路标。在下一代多核上,FSL除了延续在控制面的竞争力之外,在IO处理上也在大幅跟上,同时其节能和安全加速引擎看起来也还可以。

也许在1年前Cavium/RMI还能够比较轻松,但相信09年10年后,FSL的压力应该是很明显的。注意啊,是FSL侵入Cavium/RMI领先的领域,而不是全面的竞争。

只要FSL的内部不发生问题,从长远看,能够和Intel抗衡的还是FSL。
# ALL IP? 于 2009-06-05 9:29 pm edit

还有一个ARM,现在发展势头还是比较猛的。ARM携其在消费领域的霸主地位,正在向更高端的领域发起冲击,这是其发展的必然,也是终端消费领域发展的需要(各种智能终端产品的功能越来越强大,对CPU的处理能力必然要求更高)。

因此,在低端市场,PPC必将面对ARM的竞争。

这样看来,PPC以后的日好像不会太好过啊,前有狼后有虎,高端有Intel虎视眈眈,低端ARM在发起冲击,中间还要和MIPS周旋,苦啊。。。。。。。
# ALL IP? 于 2009-06-05 9:38 pm edit

观察处理器的时间不长,上面乱七八糟写了一些,有不对的地方欢迎各位大大指正。

此外,建议弯曲开辟一个处理器专栏,以便朋友们交流各种信息和讨论
# 老韩 于 2009-06-06 6:47 am edit

ALL IP分析的很有道理,建议也很有价值。支持。
# 陈怀临 于 2009-06-06 6:53 am edit

谢谢建议。会讨论。Stay Tuned。
# 大力水手 于 2009-06-06 9:09 am edit

赞同ALL IP的观点,未来处理器的一定是X86和ARM的天下。
intel的技术就不用多讲了,那些到现在还认为x86不适合嵌入式通信领域的就大错特错了,intel 一直没有停止过在通信市场的脚步,尽管放弃了IXP产品线,现在intel 把面向嵌入式的产品都转到X86上,后续的路标完全可以取代PPC和MIPS多核。
ARM给人的印象一直是消费电子的性能,现在新的ARM多核的DMIPS已经和PPC,64位MIPS的性能相当。ARM支持厂家众多,从纯技术的角度考虑,ARM的寿命肯定超过MIPS。
MIPS面临的困境是其性能不能和网络处理器类的产品抗衡,不能做到高端数据转发平面平台中去,如果做控制平面根本不能和Intel的多核对比。另外,基于Mips架构的芯片的性能根本不能达到厂家宣传的规格,基本上缩水三分之二。我说的是全业务流量处理,不是简单的一个没有跳转的pipeline的转发。尽管集成一些硬件加速器,个人认为还是归为通用CPU类吧。
和网络处理器相比,MIPS多核在基于通用C编程性上不可否认有一定优势,但是其问题是性能优化,问题定位,代码维护方面远不如网络处理器方便。
MIPS多核的成功在中国,没有H和Z公司的支持,RMI,Cavium估计早就坚持不住了。在无线接入,中低端路由,安全等领域占领了一步分市场,这是以前都是PPC和网络处理器的市场。
在说说网络处理器,其硬件的性能,软件的编程性,经过十几年的发展,其市场空间并没有大家预想的那么大,很多都退出了这个市场,现存的占据市场三分之一的是intel的IXP系列处理器,其次是LSI(agere),wintegra,Ezchip,AMCC等。由于intel放弃了IXP的后续研发,在高端市场上Ezchip,Xelerated两家逐渐成长起来,不过Netronome(获得IXP技术的公司)也开始发力继续开发基于IXP技术的新产品,正在迎头赶上。Xelerated 的客户就是H公司,没有H,X公司早就game over了,Ezchip尽管没有拿下H公司,但在Z公司也占有了一定市场。这两家公司主要在核心路由,光传输等项目。
高端市场上,随着Netronome的后来据上,相信高端市场的竞争更加激烈。在编程灵活性上没有一家网络处理器能和基于intel的IXP架构相比。
第一次访问弯曲评论,简单拙见,纯属个人意见,欢迎深度交流。
# aaa 于 2009-06-06 5:13 pm edit

楼上的口气很大,感觉你对网络处理器比较熟,且对其有某种偏见。

笔者认为,
1. x86不可能在通讯数据平面有所作为,这个大家已经说得很多了。纵观intel的历史,它曾经也想进入通信市场,但结果呢?然而在控制平面还是有极大的可能。Intel收购windriver,其目的很明显。用它的atom去侵入arm的已有市场。

2.PPC/MIPS不可能消亡。embedded是个细分的市场, x86, arm不可能通吃.但ppc/mips来自x86,arm的威胁会越来越大.将来的日子肯定不会太好过. PPC,现在该叫Power了. 目前主要有IBM, Freescale, AMCC支持.曾经有个PA semi,最后Apple买断了. 还有xilinx FPGA也集成了IBM的4xx core,但貌似xilinx准备抛弃它了. Freescale应当是Power的主力军,如果它哪天倒了,那莫Power(ppc) 阵营也即将瓦解. Power在IBM也就是它的server/supercomupter在用,其出货量很有限.再说,IBM现在大量采用x86作为它的处理器. AMCC就不用说了,它的主力都来自IBM.没有完整的产品线,市场份额也不大.一句话,PPC的未来就靠Freescale了.

PPC太自大,不open.相反MIPS跟PPC不一样, 它的license模式比Power要强一百倍.不少公司license了,在STB, HDTV, networking还是有不小的份额.在相当长的时间了,MIPS ISA不应该会倒.(对了不是还有个ICT的Godson??? :) ), ARM是其最大的对手了.

3.个人很看好ARM的前景, 其商业模式和产品技术上都值得称赞. 它的ecosystem很庞大很完善.其规模不亚于x86在PC市场.
技术层面,arm汲取其他体系的精华, superscaler, mutli-core,.. (mutli-thread?)还有SoC bus. AXI总线(split, out of order)..
重要的是open….成打的IP基于ARM的总线标准.
intel要打败ARM还是很难. 个人觉得intel cash flow太多, 烧得慌!

4.NP专著与data plan, 目前高端市场固然有一定市场. 但随作 mulit-core GPU with network acceleration地加入, 和设备商的ASIC/FPGA for dataplan.
市场份额下滑是一种趋势。
# ALL IP? 于 2009-06-06 5:53 pm edit

未来的处理器一定是谁的天下估计还是很难说的吧,从目前来看,Embedded处理器市场3-5年内应该是群雄争霸的时代,X86、MIPS、ARM、PPC都有一定的机会更进一步。

如果Intel真正打算向做PC一样来做Embedded的话,几年以后倒是很可能成为一支强大的力量,前提是Intel的处理器架构会为Embedded而改变吗

ARM在低端消费领域是无敌的,但要向上走,其成本功耗的优势还能有多少,还需要观察,性能要求越高,相对的对成本的敏感就相对低一些。特别是进入通信领域,可靠性要求越高。。。ARM任重而道远矣

NP最大的优势是灵活性,但灵活性也就决定了其技术的复杂性和可实现性,到目前10G/20G NP才比较成熟,而40G NP等了n年了都没有出来,100G就更不知道在哪儿了。。。在IP领域顶峰还是得靠ASIC+FPGA来搞定。NP在中低端市场还比较现实。但随着多核 CPU时代的到来,在这个领域NP和多核CPU(MIPS/PPC)有得争。。。
# ALL IP? 于 2009-06-06 6:06 pm edit

不少大侠对Intel的IPX好像很推崇。据本人的了解,IXP12xx、24xx的市场表现还可以,可能很多安全领域的在应用。

而ixp28xx,则是一种无奈的选择,当时在10G NP市场也很是热闹,可惜AMCC半途而废、IBM不干了、好像还有一个Agere,但28xx好不好可能只有用它的人才有发言权。28xx其实本质还是一个5G的NP,10G还真是难为它了,cisco后来用它做了一个5G的处理平台
# cl 于 2009-06-06 6:51 pm edit

同意楼上的。。。
# 陈怀临 于 2009-06-06 7:54 pm edit

得。这几天x86派的得势,MIPS选手不吭声了:-)。PowerPC的人马就没有出现:–(。
# ALL IP? 于 2009-06-06 8:07 pm edit

怎么这么快就划分势力范围了,陈首席觉得在下应该是哪一派呢,呵呵

吐血敲了这么多键盘,没有入得高人法眼,几无响应,积极性都有点受挫的感觉了。。。。。
# 螺丝钉 于 2009-06-06 8:31 pm edit

在通信和网络市场,我个人觉得可以从设备商的decision maker的角度看这个问题, 他们不会太关注powerpc Core还是MIPS Core, 重要的是SOC, 是接口, 是feather, 是功耗, 是die size, 是内部加速器; 如在存储市场,额外卖点在RAID接口, TOE功能等; 在无线市场, 额外卖点在SRIO, SNOW3G等; 在网络interface Card,卖点在于接口(如XAUI, SPI4), 保序,流原子, QOS等等; 从这个市场看, 并不是power跟mips的PK,而是cavium, rmi, freescale公司之间的PK.
# aaa 于 2009-06-06 8:39 pm edit

所以X86,ARM怎能一统天下呢???
不同的maket segment有不同的需求,
设备商的需求是多样的。
# aaa 于 2009-06-06 8:47 pm edit

die size设备商还关心?他们更关心money, price.

还有
* roadmap
是否有持续发展的能力。不会那天我量产时,你都关门了。
* 价格/供货
* 技术支持。
等等
# 陈怀临 于 2009-06-06 9:03 pm edit

ALL IP,我一回到家就是看是否有讨论。你们的每个发言我都是反复看和想。自己也学习了许多。
我对IA32,ARM/xScale(4xx,23xx), MIPS(5K,7K),PowerPC(4xx,7xx,74xx)都有工程级别的实战接触。这里面,我对xSCale是不太满意。换言之对IXP不太感冒。MIPS其实对系统软件工程师不太方便做大系统,特别是如果是32位系统。PowerPC和IA32不错。另外,我对EM64T,也就是x86的 64位计算看过一些东西,感觉很decent(干净)。

在最近的评论中,关于ARM要朝通信和高端设备上抢饭吃,是非常重要的,而且是在发生的。。。
# 螺丝钉 于 2009-06-06 9:07 pm edit

die size设备商当然关心啊; 比如无线市场, 很小一块板需要放入一个多核cpu, 多块dsp和fpga, die size也是很重要的; money, price, roadmap, 支持当然都是非常非常重要的, 我前面的意思是一个当前产品的卖点, 不是说公司的卖点;设备商选型当然是全方位的, 我前面更多的是指产品这一块;
# aaa 于 2009-06-06 9:37 pm edit

那是package和pin的规模.不是die size.
# JackBauer 于 2009-06-06 10:49 pm edit

40G NP已经商用。
# KISS 于 2009-06-07 1:36 am edit

@陈怀临: 我挺ppc的-曾经吃饭的玩意 :_ )

@螺丝钉: 多谢解答。继续请教一下,如果core不是differentiator的话,从应用角度来说,目前要使设备商迁移到另一种处理器/SoC是不是不存在太大困难?另外,对于芯片供应商来说,那些接口,feature,功耗,加速器也不容易差异化吧?
# KISS 于 2009-06-07 3:05 am edit

看了各位大大的帖子,也凑个数,纯属抛砖引玉

从通用core/processor的角度来说,接下来五年内的竞争非常有意思,太长远的就算了-”The long run is a misleading guide to current affairs. In long run we are all dead”。个人觉得,x86和arm现在的位置都处于上升势头。因为都有killer customer,有volume可以支撑继续投入: arm统治mobile handset,x86是pc/server。而ppc/power的位置有待持续观察,mips的形势就不太妙了。

MIPS:商业模式跟ARM雷同,缺乏占垄断性地位的市场,消费类市场高端部分肯定受arm的侵蚀,通信市场受ppc压迫,还有新进入者x86。目前来看处理器方面有完备的产品组合(低中高端),但一些MIPS vendor,如Broadcom/PMC等都不在core上继续投入了,而反观ARM,除了ARM本身,Qualcomm/Marvel等作为ARM的架构受权者都在积极推动处理器内核的研发。MIPS Technologies作为公司能不能生存下去我都觉得是个问题-最近买了chipidea又卖了就是个证据,他自己都还在寻找战略。实话实说的说,MIPS卖给ICT/Godson倒是个非常好的归宿-跟党走,大富大贵不一定,衣食无忧是肯定的,这样才可以保留一个“通用”处理器的名分。

ppc/power: 在部分市场(通信,Game Console,HPC)占一定统治地位,还有个强大的爹娘-但都三心二意。但各厂商之间研发重合,同样存在互相竞争。
IBM,嵌入式系列卖给AMCC-但却依然继续开发4xx系列内核,桌面处理器在apple那里被干掉了,服务器的POWER系列处于防御状态,mainframe也一样面临x86/IPF的进攻,而且他自身还有个强大的x86产品线。
Freescale作为公司也是有麻烦,基带部分没卖出去,公司除了占据较大市场份额的网络通信处理器,还有mcu/Arm-based应用处理器等产品线,在保证roadmap的情况下,通信处理器的统治地位短期内应该不会有什么变化。
AMCC的ppc好像是专注于storage市场?P.A.Semi有一个卓越的设计,但Apple买来就砍了。
随着市场环境的变化-arm/x86对处理器市场的渗透,各个ppc厂商都需要回答一个问题-能否保持足够的市场份额和收入来保证持续的研发投入?未来或许ppc厂商面临巨变-个人觉得成立power.org远远不够,”what if”整合成一家厂商?
顺便再搭车问一下:
1,FSL的e700是不是砍掉了?全部转到e500/e500mc?这个应该没有NDA吧,我记得2006年之前的FTF还有谈e700,2007年好像没说了,后面的FTF没关注了。
2,Xilinx嵌入405/440的FPGA主要是用在哪方面?系统厂商方面的对这种产品的感受如何?

x86: AMD几乎给不了Intel任何压力,本身已经自宫-”only real men have fabs”,如果本身的设计再出麻烦,生存都是个问题。所以Intel现在可以聚焦于“x86 anywhere”了,Intel在芯片设计和制造上的优势明显-领先6-12个月(?),技术上的两个短板low power x86 and SoC-目前有14款32nm工艺的atom-based soc正处于开发中(source: EETimes),针对嵌入式市场的software stack的软件链都正在解决中。接下来主要的PK,一是在mobile internet device上跟arm,虽说击败arm不可能,但占据部分市场份额是一定的。而且这一次必须要狠狠地打,应该是首要目标,也是接下来最大的看点。二是 GPU,x86-based Larrabee Vs NVidia。三是非MID的消费类电子,其中包括game console(这是个量很大的市场,如果赢了,可以烧掉ibm微电子的一个大粮仓了)。与上面一位大大提到的相反,在Atom上和TSMC的合作,并非不重视,而是一个战略性的举动,适当的时候可以将Atom直接授权给系统厂商(Atom的IP不对半导体公司开放的),抢占市场。另外,Intel的力量还不仅仅在技术方面,市场力量同样强大,Pentium 4可以说是一个比较失败的产品,但却依然是市场上一个成功的产品。但x86是否将通信市场视作tier-one目标就是一个问题了。

结论:long x86 and ARM, no idea on ppc, short MIPS, as general-purpose processor
# 螺丝钉 于 2009-06-07 4:04 am edit

@KISS, ,个人觉得core不是differentiator,从应用角度来说,目前要使设备商迁移到另一种处理器/SoC应该难度不大,大公司一般会做一些多核支撑平台,减少各种产品差异性; 而且迁移更多是工作量问题; 当然如果厂商特有的feather, 移植需要费点劲,如用到octeon的定时器功能,flow atomic功能的话, 迁移到rmi上就需要使用软件或者换实现方法;
对于芯片供应商来说,那些接口,feature,功耗,加速器差异化技术上讲也容易互相学习模仿, 但是市场的原因会有个继承性和一些取舍问题;比如从路标上看, rmi更侧重作更强的内核,更多的cache; cavium更侧重更多应用加速器; FSL更中规中距一些,没看到太多出彩之处; MIPS多核在安全,通信,存储等领域应该会有一席之地;
# aaa 于 2009-06-07 4:04 am edit

同意24层whoknows.

不能用PC的视角来看通信设备。
# aaa 于 2009-06-07 4:12 am edit

25层“NETLOGIC在国内的业务最主要就是hw/zte,他们需要大量使用tcam+多核处理器的方案,两个公司合并以后,可以给他们提供更好的解决方案和参考设计。”

1。问题是有多少RMI的核心成员能留下?
通常startup被收购后,人员会大量流失。
2。两家公司整合roadmap, IP merge也得需要时间。
hw/zte能等多久呢?
# aaa 于 2009-06-07 4:18 am edit

29层陈怀临

很热闹。我问一个问题。为什么?1.为什么x86更适合于PC和Server?但不能回答1说服我自己YET。”

个人认为,
1. 历史
2. 生态系统.
# aaa 于 2009-06-07 4:50 am edit

46层KISS
“x86在通信市场的看点不是Nehalem,而是将来基于Atom的SOC。…采用Atom之后,只怕每个通信处理器厂商都得紧张一下了。Intel的优势实在太多了-制造,研发力量,以及x86的低成本,但能否在通信市场成功还得看商务(business)方面的因素。”

我们不得不承认Intel有强大研发制造实力.但用一个in-order, single issue的atom集成tolapai的外设,很难想象它在网络通信市场能有多大作为.
# ALL IP? 于 2009-06-07 5:36 am edit

@ JackBauer: 40G NP已经商用?方便透露一下吗。。。。
# ALL IP? 于 2009-06-07 5:56 am edit

@ KISS:据了解FSL可能专注于e500mc了
# KISS 于 2009-06-07 6:07 am edit

补充一个有意思的说法:在80s-90s初RISC热潮兴起的时候,一度占据了server市场的很大份额,但pc上失败了,原因是:MS的OS代码较烂,而且使用了大量汇编,x86也较复杂很难移植到新平台,而服务器系统一般采用unix,代码很容易进行移植,RISC也很简单,所以小型机就挂了。
后来,随着x86的发展,同样是因为服务器上unix移植性好,而且risc也较简单,于是又转到性价比更高的x86平台了。

ps: IBM去年有一个防御性收购-Transitive,最著名的就是支持了Apple Rosetta系统背后的公司,专门用软件干这种事。
—————————————
很热闹。我问一个问题。为什么?1.为什么x86更适合于PC和Server?但不能回答1说服我自己YET。”
# aaa 于 2009-06-07 6:23 am edit

40G NP: Bay Chesapeake和Broadcom BCM88025/QE-2000都量产了.

Xelerated的HX330有望成为第一颗100G NP,
原计划2009 Q2 sample,不知道现在如何?
# KISS 于 2009-06-07 6:26 am edit

@aaa: 这里确实值得商量-free post,价值是free :_ )
1, atom不是针对网络通信市场的核,主要针对ARM。而且intel如何看待通信市场,通信系统厂商肯定更清楚。
2,atom是多线程,从指令集效率来看,或许x86的single issue可以与MIPS的1.x issue相当-不过这得根据具体应用特性
3,从低端入手,得到volume,再向高端演进是很好的做法。至于x86会否有所作为,大家一起观察…
# KISS 于 2009-06-07 6:28 am edit

@ALL IP?:thanks。这么说来freescale短期内是不会有64bit的ppc了
# aaa 于 2009-06-07 6:35 am edit

大地址空间,大内存的需要越来越迫切,尤其在高端的系统.64bit core 是一种发展趋势.
Freescale不可能miss它.无论是叫e700还是e500xx,
64bit core迟早会上.
# ALL IP? 于 2009-06-07 6:43 am edit

谢谢aaa!
我说的40G是指上行/下行都为40G,而不是上行+下行=40G。
QE-2000就是一个20G的TM,88025估计也是20G的吧,虽然提供了24GE+2×10GE接口,但实际上应该是收敛到20G,而且是以太,同时不知道性能如何?

HX330也是如此吧

—————————————
aaa 于 2009-06-07 6:23 am 40G NP: Bay Chesapeake和Broadcom BCM88025/QE-2000都量产了.

Xelerated的HX330有望成为第一颗100G NP,
原计划2009 Q2 sample,不知道现在如何?
# ALL IP? 于 2009-06-07 6:49 am edit

确实如此!

—————–
aaa 于 2009-06-07 6:35 am 大地址空间,大内存的需要越来越迫切,尤其在高端的系统.64bit core 是一种发展趋势.
Freescale不可能miss它.无论是叫e700还是e500xx,
64bit core迟早会上.
# 大力水手 于 2009-06-07 6:56 am edit

Xelerated的HX330,2009 Q2 sample,确实现在没有update了。100G的目标,基本上是cut-through,因为HX330内部TM只有50G能力的限制。
还有Ezchip 的NP4,估计也延迟了。
Bay Chesapeake基本上没有什么市场,Broadcom BCM88025/QE-2000在国内只有一个项目。
# KISS 于 2009-06-07 6:58 am edit

@aaa:
可据我所知,e500mc只是用一个传统FPU取代了SPE,最大的变动是增加了hypervisor支持。不过e500v2已经支持36bit物理地址空间了。
e700是一个64bit,4-issue(?)设计,流水也比e600长-一时找不到那篇文章了。
# KISS 于 2009-06-07 7:07 am edit

@螺丝钉: thanks
# aaa 于 2009-06-07 7:10 am edit

and…
e500mc

* 128KB backside L2 cache per core虽然个人认为少了点。

* CoreNet接口,这个很重要。

* new core to core signaling (msgsend/msgclr).

* 中断优化, interrupt proxy.

“e700是一个64bit,4-issue(?)设计,流水也比e600长”

pipeline长不是件好事.如何能达到主频要求.个人希望Freescale还能保持它的7段流水.
# 陈怀临 于 2009-06-07 7:24 am edit

我会在美西时间星期天的晚上8点,将这次大家对多核系统,处理器方面的讨论整理出来,并且发文。

我觉得是非常好的一次讨论。

我个人对处理器接触比较多,也参与设计芯片。但感觉真是天外有天。你们说的许多我都不懂。

这就是集体的力量。
# ALL IP? 于 2009-06-07 7:55 am edit

期待陈先生的整理结果,从前面各位大侠的发言中可以看出,很多人都是行内的资深人士,可能受限于职业操守和NDA的限制,在很多话题上不能深入透彻,但也可以看出不少有用的信息。

希望关于处理器的讨论能够继续下去,更希望早日能够用到我中华自主之处理器芯片!!
# matrix 于 2009-06-07 8:53 am edit

螺丝钉:
在通信和网络市场,我个人觉得可以从设备商的decision maker的角度看这个问题, 他们不会太关注powerpc Core还是MIPS Core, 重要的是SOC, 是接口, 是feather, 是功耗, 是die size, 是内部加速器;如在存储市场,额外卖点在RAID接口, TOE功能等; 在无线市场, 额外卖点在SRIO, SNOW3G等; 在网络interface Card,卖点在于接口(如XAUI, SPI4), 保序,流原子, QOS等等; 从这个市场看,并不是power跟mips的PK,而是cavium, rmi, freescale公司之间的PK.

===
这个我要顶,一看就是专家
# matrix 于 2009-06-07 9:03 am edit

1,大家对ISA讨论得很带劲。其实说白了,ISA之间的PK就一口水坑。同意KISS大大的引用—“从长远看,人都是要死的”,所以不太关心ISA之间的pk

2,我认为讨论一些更实际的东东则更有意义。上面的螺丝钉大大已经开了一个好头。各位大侠继续……
# matrix 于 2009-06-07 9:21 am edit

112楼 陈怀临

得。这几天x86派的得势,MIPS选手不吭声了:-)。PowerPC的人马就没有出现:–(。


===
首席,
windriver都让intel给收了,这几天x86自然很得势了。

mips吧,就看rmi和cavium撑撑门面,自然势单力薄。

至于powerpc吧,fsl的兄弟老大哥做惯了,不屑讨论此类问题了。

(3个打分, 平均:5.00 / 5)

雁过留声

“多核系统与网络设备的大讨论”有62个回复

  1. kunzhang3510 于 2009-06-07 11:26 下午

    各位前辈,大家为什么只讨论硬件构架呢,要实现一个产品系统软件构架也同样重要,在下有一个问题,在很多多核网络安全产品中都提到control plane and data plane,比如linux OS 只运行在某个核上作control plane,其他核上用作data plane , 我的问题是:如何控制os只运行在某个核上(就是将所有的内核线程邦定到某个核上?),或者这些只是厂家的说法而已,谢谢!

  2. 陈怀临 于 2009-06-08 4:34 上午

    在操作系统方面,如Linux,CPU Affinity是一个已经很成熟的机制,请阅读一下这方面的资料。

  3. mj 于 2009-06-08 5:41 上午

    从最近qualcomm和TI推出的SOC可以看出,ARM已经吹响了进攻高端市场的号角。
    应用和需求为王,客户才不在乎你用什么架构。

  4. zeroflag 于 2009-06-08 9:06 上午

    不是做研发的,对CPU之间的优劣没法说清楚。但是我很清楚一个数据,我们用X86的CPU做一个200M性能的安全设备,其成本,比用RMI的8核作出的1.5G性能的同类安全设备,要高很多。功耗也要高出很多。而这两款产品的售价显然是后者要高出前者很多。

    我想就这一点的区别,已经足够我们公司选择RMI而放弃X86了。事实上当初选择X86,也只是因为X86的硬件平台是现成的,可以快速出产品,而用RMI则要多一段时间才能推向市场。

  5. 老韩 于 2009-06-08 11:26 上午

    不认同4楼的意见,方便的话请举例说明,谢谢。

  6. kunzhang3510 于 2009-06-08 10:10 下午

    陈首席,我这方面的资料都看来并且做了试验,Linux CPU Affinity 是应用程序用的,应用程序通过这个可以指定自己在那个核上运行,我说的是OS,即所有的内核线程都RUN在某个核上,希望知道的前辈能指点一下,特别是做过基于多核的firewall的前辈。

  7. zeroflag 于 2009-06-12 5:17 上午

    回“老韩”:
    具体的产品就不方便说了,我只能说这是一个真实的数据。
    我不知道为什么很多人认为X86的CPU性能要好于MIPS的东西,我也确实不知道两种CPU究竟哪种更好。但是从我了解的一些皮毛来看,通信设备的典型运算都是大并发的。比如多线程的快速转发,使用RMI的8核CPU,可以并发32个硬件线程,我看到的实现是从5~32线程都是用于快速转发,也就是说27个并发的转发线程,X86的CPU性能再优秀,单核的运算能力能是RMI一个硬件线程的10倍以上吗?

    我提到的那个200M的设备,采用的是双核的至强,成本本来就高,但是性能确实不怎么样。想想双核是8核32硬件线程的五分之一的性能,基本上就意味着,一个核的性能是对方一个硬件线程的3.2倍左右的性能,也不错了。

    X86所谓的性能的优势恐怕是在浮点运算方面,而网络设备基本用不上浮点运算,那么这个所谓的优势又有什么用呢?

    再从安全产品来看,国内大多数的安全产品都是X86架构的,从来没有出过真正意义上一对端口的小包千兆线速的产品。

    所以,在我的印象中,X86做的通信产品都是低端产品。

  8. ALL IP? 于 2009-06-12 5:47 上午

    7楼:拿X86做转发,真是难为它了,它根本就不适合干这活啊

  9. Panabit 于 2009-06-12 5:59 上午

    这个讨论越来越远了,建议评论之前将那篇有170+评论的文章的评论仔细看看。现在越看越好像在做X86和RMI或者CAVIUM PK了。BTW, zeroflag,你那个双核XEON只能做到200M小包的设备是一个什么类型的设备,是防火墙之类的吗?如果真是这样,从技术角度看,那个厂家估计该关门了,呵呵。另外,多核的转发,也并不是就可以做到完全并行的,你用RMI的话,在没有POE之前,你怎么着也得找几个线程做保序用,而这些保序的线程就会是瓶颈。这方面不能用厂家提供的那些passthrough例子来说明性能,因为这个在实际中就不存在,也没有什么意义。超过内存所能承载的核是没有多大意义的。

  10. zeroflag 于 2009-06-12 6:54 下午

    Panabit:
    不是防火墙,是一个L4~7深度解包、还原、分析的东西。如果是防火墙,那也确实该关门了。
    我不是研发,不了解保序线程的性能要求,不过从现有的处理来看,也确实只用了27个线程做转发。还有5个线程用于处理别的东西,具体是什么我没问过,里面应该就有您说的这个保序线程。

    小小的debug一下,不是5~32线程,而是5~31线程。这里没有编辑功能,还真是麻烦呀!

  11. 老韩 于 2009-06-12 8:58 下午

    To zeroflag:我觉得您说的设备肯定有问题,应该越是4-7的东西,x86处理的优势越明显。最好能做个实际对比,我见过单路4核x86平台做应用层流量审计性能不到100MBbs,大量资源其实都用在数据实时编目索引和等待i/o响应上了。对您说的产品非常感兴趣

  12. 路人甲 于 2009-07-13 7:59 下午

    FreeScale确实做多核方面动作缓慢,令人失望。但PPC的社区势力强大,而且随着IBM要开始与思科一绝高低,IBM必将发力在通信,存储,数据中心等等领域,从而与思科决战。因此,IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。
    —————–
    这一段有点问题哈,貌似Power体系的网络处理芯片现在都是Freescale在做,什么时候IBM来做了?IBM做得都是Power体系的服务器芯片,网络存储芯片吧。

  13. 路人甲 于 2009-07-13 8:00 下午

    FreeScale确实做多核方面动作缓慢,令人失望。但PPC的社区势力强大,而且随着IBM要开始与思科一绝高低,IBM必将发力在通信,存储,数据中心等等领域,从而与思科决战。因此,IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。
    —————–
    这一段有点问题哈,貌似Power体系的网络通信处理芯片现在都是Freescale在做,什么时候IBM来做了?IBM做得都是Power体系的服务器芯片,网络存储芯片吧。

  14. system 于 2009-07-16 5:22 下午

    IBM做过,但是更让人失望,PPC已经开始淡出市场了,最终都会是开放架构的天下(ARM, MIPS),除了x86

  15. hehe 于 2009-08-02 4:44 上午

    matrix 于 2009-06-03 6:41 pm
    这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子,FSL ppc产品线.
    KISS大大,对于以高集成度为卖点的SoC来说,难道我们只会关注它说采用的ISA?
    # KISS.曹操 于 2009-06-04 6:11 am edit

    顺便搭车问各位大大几个问题:
    1,从OEM系统用户角度看,FSL的e500比e600的优势有哪些,对于通信应用来说?
    2,FSL的e700是不是取消开发了?QorIQ的roadmap里有没非e500的产品?
    # 老韩 于 2009-06-04 7:03 am edit

    EP80579,简而言之就是性价比不高。我一开始觉得最有可能的应用是SMB级的存储,Netgear,Linksys之流可能感兴趣,可一直没有看到。

    netgear是有在做这个产品,不过好象还没有完成设计

  16. PPPoE 于 2009-08-02 4:17 下午

    IBM做过,但是更让人失望,PPC已经开始淡出市场了,最终都会是开放架构的天下(ARM, MIPS),除了x86
    ——————————————
    powernp在同时代的产品中还行,原来有下一步的计划,退出是因为np的市场远没有达到它的预期,ibm的策略是一旦某些市场达不到她的预期,该产品线一般就会扔掉,所以用ibm的东西还是有些风险 :–),已经转到hifn了,动静不是很大了。
    “PPC已经开始淡出市场了” 远远没有,fsl销售很大一块还是这个,在高端工控,车载,基站等有不少应用,也有lisense core了。ps:mips现在日子可不好过啊,呵呵

  17. kkk 于 2009-08-05 8:12 下午

    怎么我感觉mips越来越开始上台阶了呢?
    难道站的角度不一样

  18. winux 于 2009-09-13 4:43 上午

    其实Cavium/RMI如果真的成功、或曾经那么接近成功的主要原因,就是他们致力于这片细分市场。他们用了体系较为开放的mips,再在内部总线、网络包的预处理、核间通讯等方面做了一些很有创新意义的工作,Intel为什么不做?也许不是它不能做,而是它确实没有时间顾及这片市场。

    可惜这个市场也不是那么容易做的,基于多核的产品开发,似乎都有点雷声大雨点小,似乎做安全的用Cavium比较多吧,国内用RMI也不少,RMI在北美的代表客户,Juniper,也一直没做的怎样,这些大客户们没给RMI肉吃,RMI没办法了,只好投身Netlogic,可惜了,但也许不是坏事,呵呵。

    如果Intel真有一天醒来要做这个东西,,,,,,偶觉得这个假设就一边去好了,回忆一下Intel怎么斩去网络通讯部门的吧。倒是Freescale如果醒来的话是很恐怖的,不过,就F公司退出双核的速度来看,人家似乎对此不是很感冒。

    所以,未来留给Cavium/Netlogic(RMI)的想象空间还是很大的。

    偶看楼上好多人在讨论ARM、MIPS、x86的未来,呵呵,别讨论了,技术牛不一定是最后的胜者,要看市场。

  19. winux 于 2009-09-13 4:49 上午

    写错啦,不是说freescale退出双核,是推出

  20. 李克 于 2009-09-15 1:29 下午

    应用决定系统,系统决定硬件,有些结论是比较基本的
    ASIC:商用已经超过40G,最不灵活,性能最强,JUNIPER最狠,其可编程ASIC还是很牛的,但如来如何,其核心技术是高性能和在一定程度的可编程,请灵活性及其有限
    NP:商用为20G,40G还在路标中,是微内核,性能被ASIC差,但灵活性类似CPU,但代码空间极小,代码都在内核中运行,难以处理复杂的L4-7层业务
    多核CPU:商用10G,但10G时处理业务有限,所以需要同时叠加多片,此类CPU如果能做到代码很小,完全在CACHE中运行,那么其代码空间和NP类似,当然性能也类似,但多核CPU的定位不是NP,所以不会这样用,目前处理L4-7层业务,包括防火墙,DPI,视频等比较理想,目前因为核心路由器的控制层面负载越来越高,包括包处理,虚拟路由器,逻辑路由器,NSR等需要,采用多核CPU已经是基本趋势
    通用CPU:各路大侠分析很深,不必多说,目前看不到适合做高性能处理,当然目前多核的通用CPU有上面MIPS多核有一定的相似性,目前有一些试点做路由器类设备的控制层面
    至于ARM:大侠们也都分析得很清楚,适合小型的移动和多媒体设备等,目前还看不到在10G级高性能业务使用的规划和前景
    上面的各类,基本定位明确,彼此间冲突较小,但在系统设计时,在兼顾行性能和灵活性的情况下,如果把主控板和各类接口卡也放在一起考虑,这样一个复杂的系统包括了:ASIC+NP+多核CPU+FPGA+单核小型PPC/MIPS CPU.可以想象,这样的一个系统设备,有多复杂,代码行数进千万,其压缩后的bin文件(image)超过100M,人力投入以千计,开发管理从IPD,CMM到敏捷开发,这个门槛相当的高,在国内H在第一档次,Z在第二档次,其他的各自在自己的专有领域里做问题不大,但进行这个级别的系统,不需要也不能.但是,要知道H的硬件的平台是通用的,这个平台出来后,被免费用在其他业务平台上,结果对其他业务领域造成很大的冲击,但是H对其他业务领域业务本身的理解有限,并不一定有这些业务领域的领先者高,所以H在进入这些领域好,还没能很快的爆发出力量,但是以后会怎么样,很难说,看吧

  21. wxh168 于 2009-10-14 6:08 上午

    楼上谈论了很多CPU,但我认为一个很重要的东东大家都没有谈:就是DSP,DSP目前在通信/图像处理等系统中用的非常多。
    有人说嵌入式系统复杂,掌握起来困难,我看DSP更复杂,上面没有操作系统,基本上就是自己做一个微内核来编写,调试也极其困难。
    啥时候Linux能在DSP上跑呢?
    另外多核CPU能否战胜DSP呢?

  22. 陈怀临 于 2009-10-14 8:08 上午

    有意思的话题。我想想。。。。是的,其实多核首先是在DSP领域铺天盖地的。。。。。。。wxh,现在DSP上run什么rtos,或者大多数是自己inhouse写的?

  23. 李克 于 2009-10-14 1:00 下午

    DSP早时内置用小的RISC CPU,后来为提高性能有用小型NP和多核的。DSP以前用PSOS的有,不知道现在流行什么了。DSP的商业开发的调测,确实是不大好搞,导致复杂问题的定位很烦人,操作系统是一个问题,还比较麻烦的是它作为一个大系统的一部分,难比较独立的调测系统比较难。不大懂,随便诌几句

  24. 求求首席,删华为贴吧 于 2009-10-14 3:31 下午

    陈首席及诸位高人:
    指令集的设计如何入门呢? (有了基本mips的基础了)

  25. moto.lj 于 2009-10-14 5:14 下午

    一般都是厂商的私有的RTOS,作为一个库提供,通用型的不多见,这玩意更注重高效的算法,一般都比较简单精炼。

  26. 陈怀临 于 2009-10-14 5:28 下午

    设计指令集??想干嘛?!:-) 这东西我干过。不容易。。。
    通常,你是这样的一个思维逻辑:RR模型。如果不知道什么意思。请不要继续往下读。

    然后要知道一个ISA要有I-type, R-type,J-type等。这些都还比较容易设计。。。

    比较复杂的事中断的处理。这方面是往往你们“具有基本MIPS基础”的大牛们没想到的。。。。。。
    对一个中断指令的设计,这里面涉及的问题就很多了。。。。。。

    总之,没事玩这个干嘛???现在流行的是写iphone app,android!

  27. Forrest 于 2009-10-14 9:13 下午

    TI 的DSP是自己的一个微核BIOS,只有任务调度。不过用起来感觉很好用。

  28. 帅云霓 于 2009-10-14 9:47 下午

    [对一个中断指令的设计,这里面涉及的问题就很多了]
    是不是指的这么个问题:
    在返回的时候要同时做两件事情,一是恢复原来中断的那条指令,二是同时把特权级从kernel切回到原来的状态。否则这里就是安全漏洞。

  29. moto.lj 于 2009-10-15 2:56 上午

    [对一个中断指令的设计,这里面涉及的问题就很多了]
    是不是指的这么个问题:
    在返回的时候要同时做两件事情,一是恢复原来中断的那条指令,二是同时把特权级从kernel切回到原来的状态。否则这里就是安全漏洞。

    估计还有流水线相关的问题…

  30. wxh168 于 2009-10-15 5:05 上午

    Forrest 说的对,基本上是DSP厂家提供了一个微内核,大概几百K.

    我是1周前才找到tektalk这个好地方的,这几天看了这里的文章,发现对数据通信讨论的比较多,但对于语音通信谈的比较少,希望能补充一下探讨。

    目前MGW的业务量还是很大的,但玩家很少,基本上是ERIC/NSN/ALU/H/Z这几家在玩。

    MGW的设计要求也很高,目前大部分厂家是采用DSP来做媒体处理,基本有两种方式:
    1. 拿芯片厂家的DSP,设备商自己做算法;
    2. 芯片厂家提供DSP,并集成算法进去;设备商直接使用。
    方式2的开发难度要小一些,但受制于芯片厂家更多一些。

    目前各DSP芯片商的Roadmap也是采用Multi core的,例如TI的6486,是6个核;

    同上面的各CPU相比,我认为DSP的开发调试难度最大,主要是DSP的开发受制于如下几个因素:
    1. 内存,每DSP的L2 CACHE通常是几M,片外RAM几十M;
    2. 调试,缺乏开发工具,调试极其困难,特别是内存越界问题,极其难查;

    目前有个疑问:
    1. 既然大家讨论的X86,ARM CPU未来发展迅速,能否替代DSP? 这样会大大加快开发速度。
    2. DSP实现的事情,采用FPGA/ASIC是否也能做?有先例吗?(主要是目前采用DSP做的系统集成度低,想尽一步提升)

  31. wxh168 于 2009-10-15 5:08 上午

    另外,上次和TI工程师交流,他们收购了一家小公司,准备在下一代DSP上跑LINUX;

    不过,我认为DSP内存空间如此小,LINUX内核能放进去吗?

  32. Forrest 于 2009-10-15 6:05 上午

    现在TI的Davinci系列(双核),ARM side一般就跑Linux,DSP side是BIOS。

  33. 陈怀临 于 2009-10-15 6:15 上午

    29,你说的很对。在设计异常处理(Exception)指令时,事情就变得复杂。设计指令,其实就是在设计一个处理器的微结构。而不是一个处理器已经设计好了,再来设计指令集。

    通常而言,通信公司的ASIC工程师没有能力做CPU。是不同的expertise。即使能做一个简单的NP。但一定是非常简单的。clcok很低。如果封pipeline,但其实复杂性估计不然Berkeley CS和EE的作业难。

    你们别笑,80%的工程问题,从难度而言,其实没有美国top5学校的大作业难。

  34. 陈怀临 于 2009-10-15 6:29 上午

    “我是1周前才找到tektalk这个好地方的”

    很高兴您这样appreciate我们。这就像美丽善良的女子,往往不是在烟花酒巷出没。你我行走江湖,其实念着的还是那盏万家灯火之中的温馨。

    你不是喜欢《弯曲评论》,你喜欢的是温馨:-)

  35. Forrest 于 2009-10-15 6:58 上午

    你我行走江湖,其实念着的还是那盏万家灯火之中的温馨。

    首席这句话说得太好了。

    深林人不知,明月来相照。这句诗送给tektalk.

  36. spike 于 2009-10-15 8:09 上午

    “你不是喜欢《弯曲评论》,你喜欢的是温馨:-)”
    首席真是与时俱进啊,呵呵

    “你们别笑,80%的工程问题,从难度而言,其实没有美国top5学校的大作业难。”
    能否写篇文章单独介绍一下这些个大作业都是什么样的?

  37. 陈怀临 于 2009-10-15 8:12 上午

    Heeee. 是,我这人其实挺八卦的。。。

  38. JackBauer 于 2009-10-15 8:20 上午

    VOIP网关很成熟了。
    前些年倒是有自己写代码实现算法的,不过那也是为了向IC供应商压价。
    固网产品里面,DSP工程师已经消失的差不多了。

  39. 帅云霓 于 2009-10-15 6:06 下午

    其实国内TOP20的大学大作业难度上来说也不低,只是抄袭风气非常严重,我在大学时代亲眼目睹过这些事情,每个班的作业都只有一个版本。
    据说在米国高校,这种事情的性质被认为很恶劣,甚至会导致被学校开除的后果?

  40. guoke 于 2009-10-15 6:28 下午

    我记得上学的时候,就听说高中同学形容说南开物理系专业学起来很累,能把人逼疯跳楼,精神失常,做习题一天解出半道题都很激动,不知道现在90后如何上大学

  41. Forrest 于 2009-10-15 7:00 下午

    确实是这样, 记得当时我们班作业有两个版本,男生一个,女生一个。可以说制造作业范本的同学对其他同学顺利毕业做出了巨大的贡献。

  42. wxh168 于 2009-10-15 7:35 下午

    To JackBauer:

    目前Codec的IC供应商基本上是那些DSP厂商吧,实际上是DSP厂商扩大了产业链,代替设备商把算法做到DSP内部了。

    我是想问,是否能采用ASIC/FPGA实现这些Codec算法呢?这样性能不是更高吗?

  43. wxh168 于 2009-10-15 7:36 下午

    类似于IP域,

    DSP类似于NP和多核,

    但其性能还是无法和Cisco的SPP和QFP竞争的.

  44. 路人甲 于 2009-10-15 9:11 下午

    to wxh168 : 可以采用ASIC和FPGA来实现,但是采用DSP实现主要是为了设计的可重用性。一次流片可以保证数百个应用。其实DSP这玩艺,并不一定要它和处理器的融合和集成,更确切地说,DSP更多地是工作在数据平面:)。

    呵呵,有些声码器的厂商,自己直接卖芯片,但是他卖的芯片,其实就是固化了自己算法代码的TI DSP,只不过芯片表面打上自己的logo和型号。

  45. 帅云霓 于 2009-10-15 9:43 下午

    [不知道现在90后如何上大学]
    有一次跟我大学时的辅导员,现在的学校学生处一领导聊了聊,他说,现在小孩没几个像我当年那样对科技社团的活动如此狂热(可以整夜整夜摆弄单片机),都热衷于志愿者、街舞大赛,歌唱选秀这些事情。对于实践性强的大作业,已经从每班一个版本退化到了每个系一个版本…

  46. wxh168 于 2009-10-16 3:27 上午

    To 路人甲:你的理解正确,其实从ASIC -> FPGA -> DSP -> 多核 -> x86 CPU,

    性能是逐渐下降,但灵活性/通用性逐渐提升的。

    比如今天我收到Intel给我的评估报告,采用最新的CPU: 4个Nehalem内核,2.13G 60W, Suse Linux, 处理AMR codec只能达到2000路。

    也就是4片6486的水平。

    关键是专用系统中,对功耗约束很高,对性能也要求很高,DSP都搞不定,因此我想问问是否有人用ASIC实现Voice或Video算法的,性能如何?

  47. aaaa 于 2009-10-16 4:26 上午

    ASIC实现voice transcoding… 真扯淡…

  48. aaa 于 2009-10-16 6:24 上午

    asic现在都流行集成dsp了
    arm11 /mips 24ke已经有了部分dsp指令
    最好的表现还是dsp

  49. 路人甲 于 2009-10-16 6:56 上午

    to wxh168 : 或许你可以评估下FSL MSC8156,45nm工艺的,虽然MSC8156是为无线宽带专门设计的,但是其运算密度基本上是6486的两倍。6486有些老了,还是90nm的工艺。为Core network Transcoding设计的DSP还有LSI/Agere 的SP2612。

  50. 路人甲 于 2009-10-16 7:24 上午

    to wxh168 : 2000路AMR貌似要8片6486吧?

  51. XOC 于 2010-03-22 8:37 下午

    看到各位高人在讨论多核DSP,想请教几个问题:
    1. 现在DSP中的程序很多用汇编编写,那么多核DSP的程序的开发模型应该是什么样的?虽说这要根据应用来看,但多核DSP的编成模型从总体上应该有值得提炼的地方,即应该有别于多核CPU。

    2. OpenMP是否适合多核DSP的程序开发。

    3. 多核DSP是否一定要提供BIOS.

  52. metal1011 于 2011-05-22 6:53 上午

    mark

  53. thunder1814 于 2011-05-22 9:09 上午

    mark

  54. multithreaded 于 2011-05-22 8:13 下午

    2. OpenMP是否适合多核DSP的程序开发。

    Answer: NO. OpenMP is too heavy for DSP application

    3. 多核DSP是否一定要提供BIOS.

    Only X86 requires BIOS :-(

  55. 陈怀临 于 2011-05-22 9:41 下午

    如果有人在贵公司内部胶片提议玩OpenMP,你们应该当初fire 他。马谡误国。

  56. 一条虫 于 2011-05-23 4:45 上午

    啊。。不会吧。俺刚拿OpenMP的benchmark用来多核选型。。不要fire俺啊。。首席你太狠了。

  57. 陈怀临 于 2011-05-23 7:47 上午

    选型做benchmark可以。但不要用之写release product。

  58. BULL 于 2011-07-31 7:21 下午

    认识这个地方真好,

  59. 路人王 于 2013-05-07 3:52 上午

    过几年再看这个贴, 可以证明哪些观点是对的, 也可以看出谁在裸泳.

  60. laotuinbay 于 2013-05-09 2:37 上午

    老土是第一次看这个几年前的讨论。没看完。很多内容多有娱乐。说明首席开的这个讨论好啊。这几年发展了,不太一样了。PC麻烦了。intel还没回过气。ARM更大了。大家都用ARM多核soc了,big-LITTLE了,ARM64roadmap了,双核,四核,八核多了去。MIPS哪去了。Tensilica找靠山了。Tilera还在,前途茫茫。Loongson还在玩吗?低端ARMSOC在天朝和天朝台湾(Andys)枪地盘,好像有点气势。处理器与tool chain绑得更紧了。编译器不好,处理器必完蛋。要玩多核,看看GCC或LLVM支持啥,你就用啥,错不了••••••

  61. laotuinbay 于 2013-05-09 2:55 上午

    16 nm FinFET semiconductor 年底量产。10-7 nm 技术也快了。不过,天朝不用担心。超前技术多赔钱。别人出钱出力做好了,成熟了,风险小了,立马跟进,快速赶超,错不了••••••

  62. aa 于 2013-05-19 8:51 下午

    这几年安全行业感觉发展的不是很好,玩得东西变来变去,但是市场不见大,挣钱途径很有限,竞争更多体现在销售互相欧打。追求产品更高更快更强的公司打不过靠关系拉单的公司,追求什么技术,做最好东西,恐怕很多公司都看透了,不再感冒这个了。专注技术的人,或者早早转行,才是明智之举。
    而从国内大环境看,这个行业是越来越冷,暮气沉沉,合并多,新生少,投资这个行业的人,基本深度套牢。赚钱的日子是遥遥无期的。