多核系统与网络设备的大讨论

作者陈怀临 | 2009-06-07 21:00 | 类型专题分析, 弯曲推荐, 通讯产品 | 62条用户评论 »

分享到：新浪微博腾讯微信开心人人 Live Digg FB Twitter

在《弯曲评论》发表了NetLogic买断RMI的文章之后，得到了许多读者的关注，并引发了对多核系统微处理器的热烈讨论。其中讨论的话题有：RMI的前途，RMI与其竞争对手Cavium的相关比较；后来话题扩大，读者开始讨论：x86架构，MIPS，ARM，PowerPC等在通信设备领域的优缺点。在讨论中，读者的评论中涉及打大量的最新技术和体系结构。笔者对每个评论都做了详细的阅读。并将安排自己的时间做相应的阅读。

关于多核系统，各种ISA体系结构方面，笔者在这方面的经验和思考是这样的。

应用系统决定论：
应用决定系统，系统决定硬件。换言之，是应用程序决定一切。而不是有了什么好的处理器，才有什么好的系统设计，才有什么好的应用。任何一个通用处理器设计，一个网络处理器设计，都是有其要服务的系统，要服务的应用，要服务的市场，一步一步决定其逻辑功能部件的。换言之，不需要的部件，即使从计算机体系结构的角度再好再美，都会被无情（但正确）的从die上去除出去。笔者在参与设计处理器时，经常遇见这样的事情。一开始确实不适应。但慢慢的就理解了：只有是应用的，才是正确的，也才是最佳的。最佳就是一个带有时间和空间的一个定位。能在某个时间段服务于某个产品从而获得某些市场，如果一个芯片能够为这个目标服务，这就是最佳的。

RMI与NetLogic：

简而言之，是MIPS多核+TCAM的组合。 TCAM是各大通信公司，特别是路由器公司的七寸。你算法再好，你也得Lookup快不是。读者可以试想下一代RMI的XLR或者XLP芯片有了TCAM的接口（Interface）。有兴趣的读者可以阅读笔者撰写的“思科QuantumFlow处理器及其战略研究（7）：体系结构（报文观点）”从而比较思科的QuantumFlow网络处理器的体系结构。从技术上而言，RMI与Netlogic是一个非常不错的整合。

MIPS的问题：
基于MIPS的32位操作系统，或者网络系统，具有非常大的局限性。这就是MIPS的天生缺点。2G之上的空间必须在Priviledge模式运行。这对于网络大系统，例如在下面读者aaa的评论中提及的：“aaa 于 2009-06-07 6:35 am 大地址空间，大内存的需要越来越迫切，尤其在高端的系统．64bit core 是一种发展趋势．”。这是一个非常精确的评论。从笔者的眼中，aaa读者的此言一出，笔者立刻能判断其工作的相关性质，工作范畴和能力。可谓评论中之精华。MIPS 64位系统是已经采用和将要采用MIPS ISA的系统和公司要非常注意的一个事情。要知道，问题不在MIPS本身，而在于你现在的历史代码，历史系统是否准备好（READY）了没有？32位系统朝64位系统的迁移绝非一日之功。要下定决心，但要非常慎重。

ARM朝高端系统方向发展：
这一点确实是正在发生。读者要注意，ARM朝高端发展的含义其中包括：通信设备厂商用ARM的软核设计其高端的网络通信处理器。可类比的是：思科的SPP和QuantumFlow利用了Tensilicia的Xtensa（类MIPS ISA）处理器。这方面，笔者点到为止。

PowerPC的落后：
FreeScale确实做多核方面动作缓慢，令人失望。但PPC的社区势力强大，而且随着IBM要开始与思科一绝高低，IBM必将发力在通信，存储，数据中心等等领域，从而与思科决战。因此，IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。

IA32和EM64T的野心：
Intel在IA32方面与嵌入式系统基本无关。另外在Netburst微结构时代的Intel微处理器，基本上不可能使得通信设备厂商的板子的功耗budget，散热等等方面能做得下来（电源系统，风扇系统可是一个通信设备的两大重要部分）。但Intel在转向Core微结构和现在的Nehalem微结构后，Intel芯片的生命可以说是非常的健康和旺盛。随着外网总线，互联技术的不断发展，不排除工业界的OEM厂商，例如，台湾，韩国等等，会使得中低档通信设备的Fabric，IO卡，数据处理卡等等都迅速山寨化。换言之，决战都在软件，而非硬件。如果这一天到来，基本上意味着中小型公司单独做网络处理器变得没有任何意义，除了网络通信大公司购买CPU的软核自己定制网络处理器。再出类似于RMI和Cavium这样的公司的前提将基本上不再存在。

当然，上面都是笔者自己的一家之言。有兴趣的读者可以详细阅读众多评论如下。

# Sunny 于 2009-06-01 5:18 pm edit

”估计RMI的员工基本上不可能挣什么钱“ 老陈真体恤民情呀！团队是fabless的根本，团队要散了，就啥都没有了。
# 陈怀临于 2009-06-01 8:35 pm edit

观察XLP和XLR，从网络的角度，最大的就是加了一个POE–Packet Order Engine。可以回顾一下Cavium芯片。。。我个人非常认可这一点。否则，拿软件做Packet Ordering，高端系统确实不好做。
# abc 于 2009-06-01 9:04 pm edit

应该说，XLP最大的变化是对CPU核的增强，据说单个XLP核，在同频率下较XLR性能高一倍以上
# Panabit 于 2009-06-01 9:36 pm edit

很想知道XLP的POE的详细参数和细节。不知道同Cavium的SSO比，有什么特点。
# matrix 于 2009-06-02 1:36 am edit

XLP vs. XLR
1.主要是cpu core上，XLR core是一个multi-threading标量处理器，主要面向network throughput优化(目标是memory/IO密集型业务)
而XLP core是一个4-issue,out of order,4-threading(SMT)超标量处理器，对于主控平面（计算密集型业务）和数据平面（memory访问密集型业务）都很合适。同时由于采用40nm技术，主频得以提高。所以简单地说，XLP 1 core性能是XLR 1 core 3倍。

2.POE(packet of order)引擎的引入

3.接口的变化.XLR算是10Gbps方案，XLP则是40Gbps方案。XLR support 2 XGMII/2 SPI4,4GMAC,HT.XLP support Interlaken(40Gbps),XAUI(40Gbps),pcie(16lane,2.0)

4.支持4片XLP芯片间full mesh互联(inter-chip-connect,ICI)，并保证跨芯片cache一致性和芯片消息环(Fast message network,FMN)处理一致性，用于高性能计算和100Gbps
# Jerry 于 2009-06-02 3:37 am edit

据说RMI的每个员工都有不少股票，这次他们能够赚不少钱了吧！
# 老韩于 2009-06-02 5:15 am edit

个人认为XLP内置的RAID5、6运算加速是重点。据说RMI行业收入的最大头是存储，存储无处不在，相比之下通信和安全太小了。而未来的存储一定是IP 的天下，XLS已经做到了TCPOffload，加上丰富的接口和PCI-E 4x，做HBA没有问题。现在XLP再一出来，做存储控制器应该也没问题了。
# 陈怀临于 2009-06-02 5:56 am edit

通常而言，RMI完了。Game Over了。如果对投资有兴趣的话，可以考虑购入Cavium的一些股票。当然，我的意思你如果你觉得投资这个sector有兴趣。
# slopover 于 2009-06-02 6:39 am edit

可怜的RMI，事件是无情的，不知道Cavium会怎样
# 多核产品经理于 2009-06-02 7:00 am edit

”估计RMI的员工基本上不可能挣什么钱“这句话应该是对的。据说RMI在中国的团队比较大，我想接下来就是裁员了，在中国！

本人接触过RMI的中国的技术支持，大部分都是从华为、中兴和当年的华三出去的。这些技术支持的技术能力还是很强的，RMI在中国凭借着支持团队优秀的支持能力战胜了Cavium，进入了无线、安全以及数通领域。

相比之下Cavium在中国市场的技术支持能力比较弱，在中国没有战胜RMI并不是因为的多核处理器本身，而是因为他们没有注重本地技术支持。

XLP能搞定的事情，我相信Cavium的多核处理器肯定同样能够搞定！只是我们关心的是使用哪一个会更容易，更迅速的产品化，那就不得不考虑本地支持能力。

Game Over了，也许这是Cavium的一个机会，在中国战胜RMI的好机会。他们裁员你就招人，用这些人重新占领。呵呵，看来Cavium的股票要涨价了。
# Jim 于 2009-06-02 7:45 am edit

这次收购RMI的员工可能要倒霉了，从技术上来说RMI比NetLogic强的多，也更有发展，但是运营是Netlogic的强项。老板是很爽的，但是RMI下面的员工恐怕股票要打水漂了。
# 陈怀临于 2009-06-02 8:15 am edit

我从RMI的结局，也在思考龙芯的命运。RMI的创办人和团队的技术实力与计算所打个平手应该不为过吧。你胡伟武为了中华民族复兴：-），RMI员工做 startup为了生存与活命。不应该说人家工作不勤奋。这么多的account（客户），但volume上不去，结局仍然是这样的黯然出局。

龙芯，以MIPS ISA为起点，以Linux做宿主操作系统结果目标却是通用计算机和家庭上网本。即使龙芯3流片成功，x86指令系统能虚拟化成功，但到底市场在哪里？除了曙光，谁是买家？

我个人目前持谨慎乐观的态度。
# Setev 于 2009-06-02 8:35 am edit

呵呵,龙芯!又是一个打着民族旗号的产品。大跃进式的工作方式。

掂量出自己的分量，给自己合理的定位应该是做事情的首要解决的。难道像大跃进，喊亩产万斤，难道你的一亩山坡地就真能出产5000斤了？

我倒是佩服珠海炬力这个公司。
# whoknows 于 2009-06-02 8:41 am edit

cavium下一代的处理器是65nm,这是他们致命缺陷。从投资角度来说，合并后的netlogic/rmi都
比各自更为强大，但是对rmi员工来说，这次贱卖
确实太惨了，意味着几年的辛苦都白费了
# Panabit 于 2009-06-02 8:53 am edit

我相信通过这件事情，那些一心绑定在RMI或者CAVIUM上开发自己产品的二三线网络安全厂家就要仔细考虑了，这样的风险是否是自己可以承受的，也许，X86会重新抬头。
# 陈怀临于 2009-06-02 8:57 am edit

我同意Panabit的观点。特别是Intel的最新微结构Nehalem之后，x86确实很好的架构了。
# 老韩于 2009-06-02 9:10 am edit

我还是不看好Cavium，他们和XLP对应的处理器最快也得明年才能出来吧。通过RMI这件事情，会有很多人发现，X86可能更可靠（综合）；同样，也会有人意识到自主知识产权处理器的重要。
# whoknows 于 2009-06-02 2:01 pm edit

hw,zte他们非常欢迎这次合并，这对他们是有好处的，因而，这次合并对cavium非常不利。在电信设备/网络设备市场，x86架构未来几年之内都没有机会。从接口丰富程度，从功耗来说，x86都相差太远太远。
# 陈怀临于 2009-06-02 2:06 pm edit

whoknows应该改成Iknow。连华为与中兴很high这次合并都知道：）。圈内人呀。希望多让华为或者中兴的弟兄们访问弯曲评论：-）
# youdontknows 于 2009-06-02 6:31 pm edit

我怎么听说很多华为的人已经开始唱衰这次贱卖了，而且听说RMI的很多员工已经开始跑路了，真是树倒猢狲散啊
# Panabit 于 2009-06-02 7:00 pm edit

就目前的技术层面而言，除了通用处理器是国内掣肘外，其它像POE或者局部加速的技术，国内都可以实现，因此，完全可以利用我们自身的技术，再加上X86等功能强的CPU来做一个系统。可以利用X86换掉RMI或CAVIUM的MIPS CORE。功耗方面，在高端系统，X86没有明显的劣势。至于你所说的接口丰富等方面，完全可以有外围硬件替代。另外，从长远角度看，对数据包做更高层次的检测室大势所趋，所以，数据包都经过通用CPU，而不是目前的防火墙所简单的SLOW/FAST模型，这也意味着需要功能更强的通用CPU来实现。还有，目前X86的外围网卡和芯片组已经做了很多方面的工作，比如Intel宣称的IOAT技术，就已经在网卡里增加了RSS来作为LOAD BALANCE，增加了DCA技术来将数据包DMA到内存的同时，加载到CACHE里，这些都是可以显著增强数据包处理性能的特性。
# Idontknowtoo 于 2009-06-02 7:01 pm edit

哪那些绑定在多核上的topsec，leadsec不变得前途未卜了啊？
# Panabit 于 2009-06-02 7:19 pm edit

HW,ZTE欢迎这次合作，这不太可能吧，这哪是一个积极信号，看看CISCO同这些公司的关系，难道不心存忧虑?我倒是觉得将这看着一个警钟比较好。至于国内那些将自己的全部产品线押宝在CAVIUM上的，就更加要注意了。CPU，还真是国之重器呀！
# whoknows 于 2009-06-02 8:42 pm edit

Panabit 没有真正去了解过电信网络设备领域这个行业，还在用PC领域的眼光去看问题。SOC为什么可以在网络设备大兴其道，整板成本是关键：不光是外围器件的数量可以上，加上PCB布线生产加工的难度降低。 btw,你说的intel哪些功能，cavium/rmi/freescale的芯片上都已经有了，而且在市场上卖的产品都用上了，不仅仅是一个概念而已。
# whoknows 于 2009-06-02 8:46 pm edit

员工跑路是可能的，但是，对于电信设备制造商来说，对他们是利好而不是利空。NETLOGIC在国内的业务最主要就是hw/zte，他们需要大量使用tcam+多核处理器的方案，两个公司合并以后，可以给他们提供更好的解决方案和参考设计。
# whoknows 于 2009-06-02 8:50 pm edit

功耗方面，在电信设备上的CPU是不能有风扇的。就一点你就想想跟x86架构功耗差别有多大。何况cavium/rmi都是soc，里面还集成了很多其他的接口和引擎，整版功耗比x86方案不只少一点两点
# whitebird 于 2009-06-02 9:04 pm edit

对于 OEM 厂商来说，应该是利好。说明 RMI 稳定了。

对于 RMI 员工来说，不做评论。一切皆有可能。

RMI 的技术值得尊重
# PM 于 2009-06-02 9:13 pm edit

现在那个电信厂家还在使用x86平台？
本人做了8年核心网，RNC和接入网，从TI/DSP＋ Intel/NP，到今天到muti-core，还从来没有使用过x86，从前不会，现在不会，将来也不会选择x86。

但是听说Z公司核心网使用的是x86，但我们从来不用x86，x86适合PC但不是和嵌入式这个领域。

x86好好做pc吧！

RMI不知后续如何？XLR/XLS不以后知是否还能像今天这样风光！
# 陈怀临于 2009-06-02 9:24 pm edit

很热闹。我问一个问题。为什么？

1.为什么x86更适合于PC和Server？
2.为什么MIPS和PowerPC更多用在通信？
3.为什么ARM更多用在移动设备handheld？

我个人认为我能回答2，3.但不能回答1说服我自己YET。
# PMP 于 2009-06-02 9:27 pm edit

现在那个电信厂家还在使用x86平台？
————
Juniper的路由器都有x86系统做Routing Engine
：）
# puzzled 于 2009-06-02 9:31 pm edit

.为什么x86更适合于PC和Server？
2.为什么MIPS和PowerPC更多用在通信？
3.为什么ARM更多用在移动设备handheld？

还请说说看
# Panabit 于 2009-06-02 9:32 pm edit

各位千万别误会，我并没有说X86用在电信核心网。我主要是针对国内现在的二三线网络安全厂家所做的评论。另外，Juniper等已经在走通用处理器 + ASIC的模式了，只不过用的不是X86，而是PPC等。另外，要以发展的观点看待问题。X86现在的架构已经解决了IO问题，这正式发展自己的外围 ASIC的好时机。
# 帅云霓于 2009-06-02 9:34 pm edit

试回答陈首席的三个问题：
1：X86在PC和Server行业的地位，是历史形成的。最初业界IBM和Intel的联盟造成了这个现状。Intel的X86系统，及当时操作系统DOS是开放的，因此聚敛了很高的人气。
2：MIPS和PPC属于RISC架构，性能可以做得很高，因此在专用系统中比较好用。另外MIPS属于大端(Big Endian)，与网络字节序相同，减少了转换字节序的开销。
3：ARM处理器可以做的功耗很低，很精简，因此适合没有固定电源，使用电池供电的移动设备。

不妥之处还望各位大侠指正。
# 陈怀临于 2009-06-02 9:47 pm edit

我期待大家的讨论。我看一下大家的讨论。对Panabit对系统的理解比较欣赏。能说出x86解决了I/O问题这句话，说明确实有点功力：–）。是个搞技术的好苗子。也希望其他华为的同学们看看Nehalem的介绍。

当然，并不是说Nehalem微结构可以做NS5000E的Forwarding了。只是说，事情都在悄悄地演变着。。。。。。
# puzzled 于 2009-06-02 10:01 pm edit

首席对 Netronome的NFP32XX，EZchip的NP3,以及多核，有没有相关的比较，比如针对路由器这种应用，谢谢
# 帅云霓于 2009-06-02 10:09 pm edit

X86的IO问题，我觉得根源在其体系结构，X86属于CISC，但演进到P3/P4时代实际上用RISC+微码来实现，这样造成内部晶体管数目和面积膨胀，放不下更多的I/O附件。（不能和RMI那样的SoC比啊）
因此，X86的I/O就要受外部总线的吞吐量限制了。最初是PCI，为解决这个问题又发明了PCI-X和AGP技术，但仍然是瓶颈。PCI-E出现以后好了一些，但是和RMI之类的处理器的内部IO互联、FMN还是不能相比。
如果Intel真的解决了这个问题，不清楚这种处理器功耗该有多大，价格该有多高？
# 帅云霓于 2009-06-02 10:13 pm edit

补充上面的：
如果，市面上出现了某种x86架构的多核处理器，具有强大计算能力同时，也集成了很多IO部件，性能可能优于RMI/Cavium，但由于成本、采购量等各种原因，其性价比一直低于MIPS/PPC的多核处理器，那么，在市场上Survive也是有难度的。
这里面还是用户需求的问题。光具备超强的技术/性能，傻快傻快/傻多傻多，而不能抓住用户需求，那么只可能是业界的流星。
# matrix 于 2009-06-02 10:15 pm edit

“x86解决了I/O问题这句话，说明确实有点功力：–）”
===呵呵，首席也没有必要这样损人吧？x86 IO扩展能力问题由来已久，路人皆知，了解这个问题需要功力？
新进的PCIE算是很大程度上解决了这个问题，但是PCIE在Qos方面（通道化等等）还是有瓶颈，还有一段路要走。
===
x86作为route engine没有问题，计算能力强，但是也就说明了控制平面的可行性。

===
1.x86以前没有soc方案，需要外挂桥片，这个对成本和pcb设计是一个问题（特别是中低端方案，对价格敏感）。当然去年intel也出了一个soc的片子，还集成了安全加速引擎和低速遗留接口的支持(T1,E1)，说明Intel又有做通信的想法了。

2.x86平台的功耗问题，一直让人头疼。高端的至强平台，功耗到100w+，客户单板设计相当头疼。不说100w+，就是50w，现有客户都抱怨不断！
# manofsteel 于 2009-06-02 10:16 pm edit

RMI是一家技术导向型公司，从多线程到现在的4 issue等都体现了追求技术决心，但其在芯片内部实现了这些东西固然有其好处，但是考虑一下功耗，成本，据了解RMI给客户的芯片都是LP版本的，die size都很大，成本相对都比较高。

公司毕竟是商业的，完全追求技术路线的公司很难取得最后的成功。这方面，感觉RMI输给CAvium。
# matrix 于 2009-06-02 10:17 pm edit

再论功耗问题，freescale一个宣传策略：30w功耗作为嵌入平台功耗的分界线。肯定是有一定道理滴
# 丘子隽于 2009-06-02 11:01 pm edit

有没有介绍下Freescale的PowerPC平台特点的
# Panabit 于 2009-06-02 11:54 pm edit

想不到我关于X86的一序话居然是丢下了一颗炸弹，呵呵。
# kkk 于 2009-06-03 12:06 am edit

intel Ep80579
# guest 于 2009-06-03 12:27 am edit

二三线网络安全厂商也会转RISC平台。台湾传统工控板厂商都在积极开发和推行cavium/rmi的中低端的标准板。x86平台在网络设备上的可应用范围会越来越窄。网络设备这个行业的生态跟传统的pc/server 完全不一样。
# hope 于 2009-06-03 3:04 am edit

看了很多评论,发现很多人的理解还是很肤浅.X86有它的优势也有缺点.至少在通信领域,嵌入式以MIPS和PPC为架构的多核处理器还是主流,这里有很多原因,功耗,BOM成本,IO接口,IO处理的能力,多核配套软硬件环境,IO处理能力,任何一样,X86目前都没有优势,X86的计算性能,我做过和 RMI,OCTEON对比,基本上如果同主频,OCTEON的CORE和X86一致,RMI的CORE设计相对性能较差(10级流水线,单 issue).RMI的下一代,应该讲从路标的角度讲,要比OCTEON的下一代更吸引人,多issue,多线程,加入类似OCTEON硬件保续单元等等,基本上在保留自身特点的基础上把原先OCTEON的优点都抄袭下来了.就是具体的流片时间要人担心,另外功耗也是一个主要的问题,而OCTEON的下一代相对应该更可靠,基本上只是升级工艺,更多的内核而已.现在市场上,不是你画个图给大家就可以,推出的时间点,稳定性都很重要.目前从纯计算的角度讲,如论是RMI还是CAVIUM,相对于X86也并不吃亏.
# KISS 于 2009-06-03 5:57 am edit

1，这个价格是不是贱卖不一定，现在的形势太差了，IPO基本无望，投资者退出无门，合并是一个不错的选择。合并（Merge）后如果整合成功，RMI的前途或许更光明，至少投资者看好－$NETL随着消息的宣布上涨10%+, $CAVM这两天倒是在跌。同样是上周，另一家MIPS厂商SiCortex，虽然增长势头很猛(HPC市场)－但没有新的投资进来，不得不宣布变卖资产，停止运营了。

2, x86在通信市场的看点不是Nehalem,而是将来基于Atom的SOC。上面kkk提到了Intel去年发布的EP80579，这个是Atom之前的产品，基于Pentium M “Dothan”内核的单核SoC，这个芯片TDP在11w-21w之间，90nm工艺，主频600M-1.2G，集成度丝毫也不亚于其他通信处理器。采用Atom之后，只怕每个通信处理器厂商都得紧张一下了。Intel的优势实在太多了－制造，研发力量，以及x86的低成本，但能否在通信市场成功还得看商务(business)方面的因素。

3, US半导体初创公司的美好时光已经一去永不复返了，尤其是处理器公司，再也不要想有QED那种几十亿美金的收购案了。希望在东方……:)

结论: no idea on RMI, long Intel. My two cents

To Panabit:
为什么说通用处理器是国内OEM的瓶颈，从MIPS授权IP受出口限制吗？比如最高端的MIPS 1004K。当然，即使有核，到SoC/系统也有很多工程困难。
x86的I/O问题是个什么问题？是指FSB？PCI-E等也只属于系统结构层次吧，跟ISA是不是x86没关系.
# KISS 于 2009-06-03 5:58 am edit

ft
为什么Natal的评论需要被审核？
# 陈怀临于 2009-06-03 6:08 am edit

系统的AI智能决定是否审核：-）。可见机器人永远不能战胜人。
# KISS.曹操于 2009-06-03 6:15 am edit

tektalk明天也系统维护吧。
好像凡是明天不处于技术维护状态的网站，都属于不怎么样的网站：）
# guest 于 2009-06-03 7:36 am edit

atom性能太差，而且intel都将其生产外包给台积电，可见其在intel中的地位。 intel在通信市场近期难有作为，即便是传统的防火墙厂商(topsec/网御/网神)，他们也都认识到了这个问题，正在积极转型。
# 老韩于 2009-06-03 8:16 am edit

EP80579是比较失败的产品，自身不过硬，又在错误的时间出现，天时地利人和都不占便宜，据说到现在几乎没有国内安全厂商采用。平心而论，我认为那个平台还是不错的。
# matrix 于 2009-06-03 6:41 pm edit

“x86的I/O问题是个什么问题？是指FSB？PCI-E等也只属于系统结构层次吧，跟ISA是不是x86没关系.”
===显然，上述讨论不是讨论ISA之间优劣。
这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子，FSL ppc产品线.

KISS大大，对于以高集成度为卖点的SoC来说，难道我们只会关注它说采用的ISA?
# aaa 于 2009-06-03 7:20 pm edit

看看这些
Netlogic <—RMI
Netronome <— Intel IXP
IDT <— Tundra

寒冬呀，日子不好过。
个人不看好RMI, Netronome，小厂家。
做方案还是用大厂家的多核吧.
# Panabit 于 2009-06-03 7:58 pm edit

我觉得，从RMI被贱卖这件事情，看到的不是对谁有利亦或不利，而是一个信号，就是一个我们产品所依赖的第三方是否稳定的信号。我们可以想一想，如果当自己的产品线全部采用RMI或者CAVIUM的时候，一旦出现不稳定的信号，自己是否可以承受。当然这个能否承受与否，是因公司而异的。我并不是竭力推荐 X86，我只是说,X86同以前相比，已经有了很多积极的变化，而且这种变化还在持续下去，比如最新出现的i7，其QPI，总线方面，PCIE 2.0的支持已经多通道内存的支持，这些都是积极的变化。从CPU的角度看，X86无疑是强劲的，当然接口肯定不能同通信处理器相比。不过我认为，如果厂家自己有能力丰富接口而弥补这些不足，X86倒不失为中高（高-）端安全产品一个较好的选择。现在的安全产品有一个趋势是朝应用层发展，这也对更多的 CPU处理能力提出了要求，X86在这方面无疑是有优势的。至于matrix兄，陈首席可不是在损我，你要相信这一点，呵呵。大家都在以自己的经验去看待事情，有时不妨适当跳出一下自己的圈子，呵呵。
# Panabit 于 2009-06-03 8:12 pm edit

回KISS兄弟，我说的X86 IO问题主要是指：
1）内存带宽和CPU之间的扩展性
2）CPU和外部设备之间的连接扩展性
早期大家也知道，通过FSB和北桥，内存带宽不具备同CPU同步的扩展性（当然现在也不是100%同步，但是已经是一个极大的变化了）。至于2）QPI和PCIE虽然不是那么完美，但是至少已经足以对付相当大的IO带宽要求了。
还有一个积极的变化是，IOAT。我觉得IOAT中最值得欣赏的特性是DCA(Direct Cache Access)，这个特性用的得好，对小包的吞吐会有相当大的贡献量。其它的特性如RSS，如果自己做外围ASIC或FPGA的话，完全可以自由发挥，倒没有DCA那么明显了。
# guest 于 2009-06-03 8:25 pm edit

说实在的，个人感觉panabit兄对cavium/rmi/freescale的芯片不是很了解，甚至对x86也不是很了解，所以才不能正确去比较它们的优势和劣势。感觉你是在安全行业，但是对安全产品的硬件方面，也不是太了解，所以，觉得很多看法感觉只是隔靴搔痒，说不到点子上。x86在安全产品有市场，完全是历史的原因，现在这个市场正在远离它。随着安全厂商的成熟，他们有能力去构建自己的软件平台的时候，基于非x86平台的解决方案会占越来越多的份额。就拿高端来说，用 risc加内容过滤芯片的组合，性能上会比x86 纯软件的方案会强很多。拿 I/O 说，pcie总线由于协议复杂，有效数据的吞吐量只有理论值50%左右。这个对于高端系统会成为吞吐的瓶颈。

当然，最终的胜者还是要靠市场来决定，就像当年HT/PCIE之争，rambus/ddr之争，最终胜出的不是性能最好的，而是市场能接受最快的。
# matrix 于 2009-06-03 8:26 pm edit

panabit兄，供应商的稳定性问题，肯定是设备商最关心的问题。当年H3C在greenfield上栽了大跟斗，所以HW,ZTE等大客户在风险控制方面的经验肯定多多。

btw，我们也要破除供应商就一定是大厂商的迷思。Intel不是也把IXP系列给倒手了吗？对于像Intel这样大恐龙，瞧得上通信处理器（甚至是通信多核处理器）这个细分市场吗？
退一步说即便是Intel重新玩通信处理器这个市场，Intel这个级别的公司，按照它的运营模式一定能够在这个细分市场赚得盆满钵盈吗？

startup在创新肯定有可取之处，否则在美国这个充分竞争市场，根本就没有存在的必要。

其实这方面可以学习cisco，对于有价值的startup加以收购（当然，这个又要考虑米国政府同意与否了）。
# guest 于 2009-06-03 8:29 pm edit

panabit 兄，我觉得你需要认真研究一下cavium/rmi的芯片再来讨论会更有意义些，因为我感觉你似乎完全不了解他们。如果我说错了，请见谅
# matrix 于 2009-06-03 8:41 pm edit

“拿 I/O 说，pcie总线由于协议复杂，有效数据的吞吐量只有理论值50%左右。这个对于高端系统会成为吞吐的瓶颈”
===guest兄，吞吐真还不是大问题。pcie 2.0 5Gbps per lane，multi-lanes问题不大。再说传说中的pcie 3.0，8-10Gbps per lane，就更不是问题。

pcie的问题还是Qos，通道化支持channelization suppport）,flow control弱。作为packet interface，先天不足，不能和SPI4 Interlaken接口pk。
# 陈怀临于 2009-06-03 8:43 pm edit

行，文人相轻的老毛病快要出来了。其实，技术观点通常都是各有道理。这与个人的经历有关。所以不要勉强。互相学习才是王道：-）。
我现在有个好的习惯。我特别讨厌开会。但只要我去参加一个会，我事先会想尽方法告诉自己我要学到点东西。否则，我参加会议是受罪：-）

关于Matrix的“其实这方面可以学习cisco，对于有价值的startup加以收购（当然，这个又要考虑米国政府同意与否了）。”。如果您阅读我这些年关于华为的文章，其实是在劝他们在技术上做好准备，购买公司，扩展起来。

华为目前山头林立。藩王遍地。而且许多人极端自信。认为什么都可以和应该自己做。

我拭目以待。
# Panabit 于 2009-06-03 8:43 pm edit

会58楼：
guest，谢谢你善意的提醒。Cavium和RMI的东西，我很早就有研究过了。当时国外一家公司在国内的Cavium性能验证工作也是我做的（当初是CN38XXX刚出来的时候）。关于它的那个POE改成SSO这个名称，我也知道其为什么改的，呵呵。
# 陈怀临于 2009-06-03 8:51 pm edit

这篇文章本身一般，就是报道一个业界收购。但引发的讨论相当优秀。基本上涉及到了目前通信业界的精华。而且人员参与感觉来自各大通信公司的骨干人员。我自己也学习到了许多东西。我会把这篇文章标注为“弯曲推荐”。
# matrix 于 2009-06-03 9:16 pm edit

Panabit 兄，”我觉得IOAT中最值得欣赏的特性是DCA(Direct Cache Access)，这个特性用的得好”

===
Intel的DCA特性不清楚，DCA哪年推出不知道。
但是这个玩意不是新东东。RMI XLR推出之时，就有一个L2 cache Allocate功能，报文DMA到内存的同时，可以把报文同步搬运到L2 cache，后续软件处理可以有效减少cache miss rate，从而提高性能。

注意这玩意XLR一直都有，XLR是多少年前的产品了？
# Panabit 于 2009-06-03 9:25 pm edit

Matrix 兄，你说得很对，的确是这样的。正是由于这些，所以我说X86正在发生积极的变化。IOAT的推出我想有3年左右吧（所以应该比XLR晚一些，至于 DCA，应该是07年出来的，是IOAT2中的内容，所以就更晚了）。另外，据我所知，XLR刚开始推出的时候，是将小于112 Bytes的包放在内存中，所以当时Cavium在这方面的测试结果要差于RMI。后来Cavium也做了这一点（但是好像是98 Bytes以下的报文，这两个数字我需要再考证一下）。Intel的这个DCA特性强在什么地方，就是它拥有相比CAVIUM或者RMI大得多的L2和 L3 CACHE，所以能够同步更多的报文。
# matrix 于 2009-06-03 9:41 pm edit

Panabit兄，你对RMI packet L2 cache allocate功能理解有误。

它有一个寄存器，可以控制报文头部多少字节同步搬运到L2 cache。比如说，设置寄存器为0xf，则搬运packet header 15个cacheline（32 byte）= 480字节进入L2 cache。

报文整体都在内存中，但是报文头在cache，而一般报文处理显然处理报文头的几率大得多！
# aaa 于 2009-06-03 9:43 pm edit

DCA?
Freescale叫它为cache stash.
从MPC8560, 03年就有了。
到了P4080，都能stash到指定的L1, L2, L3 cache。
# aaa 于 2009-06-03 9:45 pm edit

还是matrix是行家里手
# Panabit 于 2009-06-03 9:50 pm edit

Matrix 兄，“报文整体都在内存中，但是报文头在cache，而一般报文处理显然处理报文头的几率大得多”，我赞成你的观点。可以控制SIZE的特性是刚开始就有的吗？这是一个非常好的特性，Intel的DCA目前还缺乏这方面的东西，或者说目前支持IOAT的网卡或其它外围设备还不支持这个可控SIZE的特性。另外我想再阐述的是，我的观点并不是否定或完全肯定任何一种架构，我的核心观点是，当我们一直对某个东西熟悉，并心里否定另外一个东西的同时，不妨想一想，“我这样对不对？”。另外，架构的选择也同自己面向的领域和产品形态息息相关（当然这都是废话了，呵呵）。通过X86这个“炸弹”，我学到了很多东西，也希望弯曲评论越办越好！:)
# matrix 于 2009-06-03 9:54 pm edit

aaa兄，P4080 宣传今年Q2样片。现在能够sample了吗？

FSL通信处理器老大哥做惯了，市场需求反应有些迟钝呀。
# Panabit 于 2009-06-03 9:55 pm edit

Matrix 兄，“报文整体都在内存中，但是报文头在cache，而一般报文处理显然处理报文头的几率大得多！”，我非常赞同你的这个观点。另外，XLR的这个控制 SIZE的寄存器是一直就有的吗？这个特性是非常有用的，它可以让你在CACHE POLUTION和性能之间自己来做平衡。Intel的DCA，或者支持DCA的网卡或其它设备缺乏这种特性。
# Panabit 于 2009-06-03 10:09 pm edit

Matrix兄，有兴趣的话，私聊一下，我的MSN: softmic_msn@hotmail.com。
# Panabit 于 2009-06-03 10:11 pm edit

感谢弯曲评论这个平台，让我认识到这么多高手，衷心祝愿弯曲评论越办越好！！！
# aaa 于 2009-06-03 10:16 pm edit

matrix兄,有同感。
FSL确实是有点钝。
这不，被Cavium和RMI的多核逼上梁山。
# gg99 于 2009-06-04 1:12 am edit

问陈首席的问题，貌似netlogic买断rim是为了增强其 multicore processor+tcam业务，这个业务与np+tcam在交换路由或者其它领域会有冲突吗，国内的厂家像HW,ZTE,DATANG,H3C现在用的主要是cavium还是rim为主（与tcam结合的部分）？
# Racoon 于 2009-06-04 5:38 am edit

前面Matrix兄和Panabit兄提到RMI packet L2 cache allocate功能，确实可以通过配置将部分报文直接放到L2 cache里，但问题是此时报文还没进入CPU内部进行处理，仍然积压在其硬件加速单元里。大量尚未开始处理的报文占用L2 cache，必然会导致正在处理的报文出现cache miss的可能性增大，对性能也没有好处。
当然在流量较低时，使用这个特性可以降低单个报文的处理周期。
所以个人感觉这个功能没啥用，呵呵
# KISS.曹操于 2009-06-04 6:00 am edit

@老韩: EP80579确实算是比较初级的SoC产品-只是把传统的Core＋北桥＋南桥＋加速器做到一个die上，感觉并没太多系统级优化，例如互联设计等。

你说的失败的地方主要是哪里？芯片指标不过关，还是软件栈支持不好，或是系统开发方面？
—————————————-
老韩于 2009-06-03 8:16 am
EP80579是比较失败的产品，自身不过硬，又在错误的时间出现，天时地利人和都不占便宜，据说到现在几乎没有国内安全厂商采用。平心而论，我认为那个平台还是不错的。
# Panabit 于 2009-06-04 6:07 am edit

Racoon兄，你说得对，会有这样的问题的，所以那个可配置的SIZE寄存器是一个很好的特性。这个对小包的贡献还是挺大的，X86的CACHE比较大，也会好一些。
# Panabit 于 2009-06-04 6:09 am edit

Racoon兄，你说得很对，的确有这样的问题，这实际上是对CACHE产生的POLLUTION了。所以那个可配置SIZE的寄存器就很重要。这个特性对小包的贡献是蛮大的。特别是在做性能测试的时候，呵呵。
# KISS.曹操于 2009-06-04 6:10 am edit

@matrix大大
隔行如隔山啊，术语涵义不同，看到x86的第一反应就是ISA，不是系统，呵呵
—————————————-
matrix 于 2009-06-03 6:41 pm
这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子，FSL ppc产品线.
KISS大大，对于以高集成度为卖点的SoC来说，难道我们只会关注它说采用的ISA?
# KISS.曹操于 2009-06-04 6:11 am edit

顺便搭车问各位大大几个问题：
1，从OEM系统用户角度看，FSL的e500比e600的优势有哪些，对于通信应用来说？
2，FSL的e700是不是取消开发了？QorIQ的roadmap里有没非e500的产品？
# 老韩于 2009-06-04 7:03 am edit

EP80579，简而言之就是性价比不高。我一开始觉得最有可能的应用是SMB级的存储，Netgear，Linksys之流可能感兴趣，可一直没有看到。

Intel现在已经把80579边缘化了，后期传说中加入IXP RISC核的计划也停了，现在推的是Atom和ce600/1G。
# 陈怀临于 2009-06-04 7:07 am edit

得，Intel买断Windriver。x86进入什么市场？嵌入式：-）
# matrix 于 2009-06-04 7:31 am edit

今天简直太匪夷所思—Intel 收购windriver

难道intel要大举进入嵌入处理器市场（通信处理器算是其中的细分市场）？

难道要首先收购windriver，给powerpc和mips一个下马威？

服了，真是混乱年代，必须神经彪悍！
# cl 于 2009-06-04 7:42 am edit

当然，并不是说Nehalem微结构可以做NS5000E的Forwarding了。只是说，事情都在悄悄地演变着。。。。。。
————————–

1，字节序
2，x86作为通用处理器。架构优先考虑内存带宽。IO性能差，接口不够丰富。总体价格高。通信处理器瓶颈不在计算能力。
3，不过freescale继续熊下去，相信不远ppc就会被x86和mips消灭掉。。。
# 秋风于 2009-06-04 8:53 am edit

这两天还在与windriver的人交流Wind River Test Management。我还说难道Wind River也要学Thoughtworks做咨询公司了。不想晚上就看到被Intel收购的消息。
世界变化之快，真是太刺激了。
# aaa 于 2009-06-04 2:17 pm edit

Intel想干嘛？
一统天下？干掉arm/ppc/mips?
# 陈怀临于 2009-06-04 2:25 pm edit

不知与ATOM芯片的长期发展是否有关系。反正，加强软件力量，获得一大批已经存在的客户account意思是事实了。换言之，华为的VRP vxworks是捏在Intel的手上了。咔咔：-）
# aaa 于 2009-06-04 2:34 pm edit

这桩收购，带来很多变数．
投奔QNX?
# aaa 于 2009-06-04 2:40 pm edit

Freescale这下该找谁（montavisa, Green Hills, QNX???)来支持它的芯片？

Cavium还有Netlogic(RMI)它们该如何面对呢？
# 5np4g.powerpc 于 2009-06-04 5:20 pm edit

montavisa我记得好像是Intel是背后最大支持者，powerpc这几年确实有些没落了。。。
# anonymous 于 2009-06-04 5:58 pm edit

华为对intel的芯片很清楚的，有专门的团队在研究，intel也有一个专门团队跟华为负责接口。而且，华为内部也作了intel的刀片，跑suse linux, 供内部使用，以及搭售服务器的时候顺带卖卖。

做设备厂商，性能不是最重要（能满足市场规格就可以)，整板，整框设备成本能降下来才最重要。买一个设备挣一笔钱，在选型的时候，某个方案可能因为多一个FPGA片子都可能会导致出局。所以，intel不做soc,基本上没有可能能赢通信市场。
不过，收购windriver,倒是增加了很多变数。
# anonymous 于 2009-06-04 6:10 pm edit

VRP 只是数通的软件平台。其他产品线不是基于这个。更底层的是Dopra。不过，hw所有的东西都是工程化很好: 模型简单，上手快(新员工能很快干活),调式手段丰富(出了问题可以有很多追踪/排查手段，这个很对工程化及其重要)。但是，从纯软件设计角度看，结构很差，很混乱，效率/性能也是非常低。
# hope 于 2009-06-05 2:22 am edit

1. X86的对于嵌入式系统来讲,是综合性的欠佳,不是单一的某个方面.比如讲功耗,有人说ATOM的功耗很低,可是你仔细看下ATOM的功耗低是只它这颗芯片的功耗,没有包涵外部的桥芯片等等.而现在的嵌入式系统都是SOC,我们讲RMI还是OCTEON,这些芯片是都是直接出几十G的外围接口,在看看通信设备的需求,有XAUI/PCIE/SERDES等等不同的接口,但是X86就需要挂桥,还是桥,这个整板的功耗是多少?这个成本又变成多少.所以大家看问题要站在系统设计的角度去看,而不是只是单纯的从一颗CPU,单纯的看它的CACHE有多大,主频有多高.真正有系统设计经验,熟悉多核的架构师,应该会明白我的意思.而不是只是简单的测试一下.
2. 至于安全厂商大量应用X86架构是有历史原因的.而且目前众多的安全厂商正在转入MIPS多核领域.
3. 目前对于华为这类通信厂商,其平台软件是综合支持各类体系的CPU,无论你是MIPS还是X86,这个无论哪家厂商出问题,华为收到的影响有,单不是绝对的,只要软件适应多核架构,有被选的方案,并不是主要问题.RMI被收购,其实从可靠性来讲,倒是更好了,要不作为私有股权,RMI就像是一颗炸弹,这回加入NETLOGIC,反而应该会有更好的发展,倒是CAVIUM面临的竞争会更激烈,因为相对来讲CAVIUM芯片从将来讲,可能整合性会弱于RMI. 比如RMI+TCAM?一切皆有可能
4. 风河也被收购了,又一颗炸弹.大家都能看到上网本的火爆,导致了嵌入式超便携系统的可能,而这个系统,intel还是微软都没有绝对的把握,所以收购风河,加强自己的软件能力,也许有一天intel会收购CAVIUM,who knows.
# KISS 于 2009-06-05 11:35 am edit

@hope:
1，你可以用Intel EP80579和Cavium CN52xx或PQ III MPC854x做一个详细的比较－外围接口，价格。另外，Atom的设计功耗是Dothan的1/10，相信基于Atom的SoC也会解决SoC的架构问题。或许x86作为通信处理器的最大障碍是software stack支持的问题，性能scaling对于Intel来说不是问题－只是来自非系统工程师的看法。
2，IMHO，Intel绝对不会收购non-x86的半导体公司了－肯定也不会收购AMD 我觉得XScale/IXP的出售都说明了他对x86的信心。
# 随便扯两句于 2009-06-05 7:21 pm edit

@kiss
Tolapai平台在国内已经发布快一年，跟intel一贯的做事风格类似，发布时就已经携带了很多合作伙伴做好的应用来展示，基本上是已经成型的产品。但是，目前市场上用于这个平台的产品并不多，在二三线安全厂商有一些产品，不过也不知道市场卖的如何。Tolapai的双核版本好像还没有发布。至少目前从市场看，Tolapai还不能说有多大成功。

和你的观点恰恰相反，如果x86是software stack的问题，intel很容易去解决。想当年IXP多么庞大的软件库，intel都做得非常好，所有通信厂商都对此赞不绝口。我以为还是和硬件/系统设计相关部分的才是目前x86的弱点。

Xscale/IXP出售不是对x86的信心，而是迫于无奈:看不到获胜的前景。在出售他们之后很长一段时间内，直到现在，intel对于如何重新进入这一市场没有明确路线图。

而当初intel进入NP市场，软件/硬件/文档/客户培训都是做的非常到位，所以很快能把其他家NP拉在身后。
# ALL IP？于 2009-06-05 8:14 pm edit

很热闹，在下也来班门弄斧一把。

X86当前来看在通信领域的应用作为控制面比较合适，而且是在对CPU性能要求比较高的控制面应用，以及对高层业务处理比较多的特定领域，例如DPI。

Intel在Embedded领域是有大的动作，X86也在向SOC方向发展，但其主要基于PC应用的视角设计的处理器确实不适合作为数据转发应用，个人判断未来几年内Intel的X86处理器在转发领域难有所作为。如果Intel确实想进入这一块市场，只能通过收购一家合适的公司，靠自己的得看 3-5后的X86新架构如何做了
# ALL IP？于 2009-06-05 8:25 pm edit

Intel 收购WindRiver的影响估计通信业界都会在看，看Intel的后续策略，如果其能保持原有的第三方态度，能够很好的支持PPC/MIPS的后续发展的话，Vxworks在通信领域会得到继续的发展。但这点很难，这和intel想在Embedded领域大展拳脚是冲突的。

linux和FreeBSD之类的软件可能会对此次并购持欢迎态度。相信有长远目标的公司对是否继续使用vxworks会进行深入的评估，很可能会转型，因为PPC/MIPS的新一代处理器如果Intel不支持，其后续的产品是没有发展的。
# ALL IP？于 2009-06-05 8:35 pm edit

X86在数据面的应用，先不考虑其性能如何，首先产品的系统方案就会很复杂，需要配合大量的外围芯片，硬件综合成本非常高，工程实现也是一个很大的挑战。
# KISS 于 2009-06-05 8:39 pm edit

@随便扯两句:
thanks for your information
我想问个问题，如果Software stack等等不是问题的话，Tolapai(1088-FCBGA)的封装－比CN52xx(729-BGA)和PQ III(783 FC-PBGA)多了300+个pin－对系统设计的芯片选型大概有多大影响? 是不是对board cost/reliability等等方面来说。

顺便请教一下各位大大：一般来说本土厂商系统工程师选择芯片大概是个什么样的优先级？
# ALL IP？于 2009-06-05 8:48 pm edit

RMI要被卖掉在圈子里面已经流传了很久，应该是一个半公开的秘密，可能最大的秘密就是谁来接盘了，没想到突然爆出Netlogic来。

TCAM由于其优异的查找性能在转发领域的贡献是有目共睹的。由于TCAM的功耗与其容量基本是线性增加，随着路由表和转发表越来越大，在核心路由器领域，TCAM的容量问题已经成为转发表的一个瓶颈。

在中低端领域，10G以下处理能力的设备，低成本的解决方案还是比较多的，RMI的竞争力并不是很明显。

如果如前面的大侠所评论的那样，Netlogic希望通过收购RMI来增强其TCAM的竞争力，用处多大实在难说。一句话，Netlogic收购RMI的效果有待继续观察。
# ALL IP？于 2009-06-05 9:01 pm edit

根据个人的经验，大厂是不能迷信的，这年头，挂羊头卖狗肉的多去了。观察某个产品的长远发展要看这个产品在其公司的地位，只有其核心产品的保障性才强一些，外围产品特别是跟风想赚一把的，前景都不太美妙。

IBM实力强吧，但因为NP得市场对于IBM来说实在太小了，发展又要投入很强大的力量，最终还是放弃了。

Intel更是前科不少，在光通信一片火热的岁月，Intel也毫不犹豫的进入，收购一些公司，不知道有没有听说过Intel的10G光收发模块，但现在早就解散了，其相关的IC业务也卖完了。还有IXP的例子，前面的大大已经说了不少。
# ALL IP？于 2009-06-05 9:20 pm edit

Cavium在下一代多核的进展上好像碰到困难，其路标已经再三推迟。。。Cavium在这个领域能走多远，也许很大程度上就决定于其下一代多核的成败上面。

Freescal在多核上反应比较慢，不过终于还是反应过来了，不管是CORE还是芯片规划，在后续的发展上有着相对清晰的路标。在下一代多核上，FSL除了延续在控制面的竞争力之外，在IO处理上也在大幅跟上，同时其节能和安全加速引擎看起来也还可以。

也许在1年前Cavium/RMI还能够比较轻松，但相信09年10年后，FSL的压力应该是很明显的。注意啊，是FSL侵入Cavium/RMI领先的领域，而不是全面的竞争。

只要FSL的内部不发生问题，从长远看，能够和Intel抗衡的还是FSL。
# ALL IP？于 2009-06-05 9:29 pm edit

还有一个ARM，现在发展势头还是比较猛的。ARM携其在消费领域的霸主地位，正在向更高端的领域发起冲击，这是其发展的必然，也是终端消费领域发展的需要（各种智能终端产品的功能越来越强大，对CPU的处理能力必然要求更高）。

因此，在低端市场，PPC必将面对ARM的竞争。

这样看来，PPC以后的日好像不会太好过啊，前有狼后有虎，高端有Intel虎视眈眈，低端ARM在发起冲击，中间还要和MIPS周旋，苦啊。。。。。。。
# ALL IP？于 2009-06-05 9:38 pm edit

观察处理器的时间不长，上面乱七八糟写了一些，有不对的地方欢迎各位大大指正。

此外，建议弯曲开辟一个处理器专栏，以便朋友们交流各种信息和讨论
# 老韩于 2009-06-06 6:47 am edit

ALL IP分析的很有道理，建议也很有价值。支持。
# 陈怀临于 2009-06-06 6:53 am edit

谢谢建议。会讨论。Stay Tuned。
# 大力水手于 2009-06-06 9:09 am edit

赞同ＡＬＬ　ＩＰ的观点，未来处理器的一定是X86和ＡＲＭ的天下。
intel的技术就不用多讲了，那些到现在还认为ｘ８６不适合嵌入式通信领域的就大错特错了，intel 一直没有停止过在通信市场的脚步，尽管放弃了ＩＸＰ产品线，现在intel 把面向嵌入式的产品都转到Ｘ８６上，后续的路标完全可以取代ＰＰＣ和ＭＩＰＳ多核。
ＡＲＭ给人的印象一直是消费电子的性能，现在新的ＡＲＭ多核的ＤＭＩＰＳ已经和ＰＰＣ，６４位ＭＩＰＳ的性能相当。ＡＲＭ支持厂家众多，从纯技术的角度考虑，ＡＲＭ的寿命肯定超过ＭＩＰＳ。
ＭＩＰＳ面临的困境是其性能不能和网络处理器类的产品抗衡，不能做到高端数据转发平面平台中去，如果做控制平面根本不能和Ｉｎｔｅｌ的多核对比。另外，基于Ｍｉｐｓ架构的芯片的性能根本不能达到厂家宣传的规格，基本上缩水三分之二。我说的是全业务流量处理，不是简单的一个没有跳转的pipeline的转发。尽管集成一些硬件加速器，个人认为还是归为通用ＣＰＵ类吧。
和网络处理器相比，ＭＩＰＳ多核在基于通用Ｃ编程性上不可否认有一定优势，但是其问题是性能优化，问题定位，代码维护方面远不如网络处理器方便。
ＭＩＰＳ多核的成功在中国，没有Ｈ和Ｚ公司的支持，ＲＭＩ，Ｃａｖｉｕｍ估计早就坚持不住了。在无线接入，中低端路由，安全等领域占领了一步分市场，这是以前都是ＰＰＣ和网络处理器的市场。
在说说网络处理器，其硬件的性能，软件的编程性，经过十几年的发展，其市场空间并没有大家预想的那么大，很多都退出了这个市场，现存的占据市场三分之一的是intel的ＩＸＰ系列处理器，其次是ＬＳＩ（ａｇｅｒｅ），ｗｉｎｔｅｇｒａ，Ｅｚｃｈｉｐ，ＡＭＣＣ等。由于ｉｎｔｅｌ放弃了ＩＸＰ的后续研发，在高端市场上Ｅｚｃｈｉｐ，Ｘｅｌｅｒａｔｅｄ两家逐渐成长起来，不过Ｎｅｔｒｏｎｏｍｅ（获得ＩＸＰ技术的公司）也开始发力继续开发基于ＩＸＰ技术的新产品，正在迎头赶上。Xelerated 的客户就是Ｈ公司，没有Ｈ，Ｘ公司早就game over了，Ｅzchip尽管没有拿下Ｈ公司，但在Ｚ公司也占有了一定市场。这两家公司主要在核心路由，光传输等项目。
高端市场上，随着Netronome的后来据上，相信高端市场的竞争更加激烈。在编程灵活性上没有一家网络处理器能和基于ｉｎｔｅｌ的ＩＸＰ架构相比。
第一次访问弯曲评论，简单拙见，纯属个人意见，欢迎深度交流。
# aaa 于 2009-06-06 5:13 pm edit

楼上的口气很大，感觉你对网络处理器比较熟，且对其有某种偏见。

笔者认为，
1. x86不可能在通讯数据平面有所作为，这个大家已经说得很多了。纵观intel的历史，它曾经也想进入通信市场，但结果呢？然而在控制平面还是有极大的可能。Intel收购windriver，其目的很明显。用它的atom去侵入arm的已有市场。

2.PPC/MIPS不可能消亡。embedded是个细分的市场, x86, arm不可能通吃.但ppc/mips来自x86,arm的威胁会越来越大.将来的日子肯定不会太好过. PPC,现在该叫Power了. 目前主要有IBM, Freescale, AMCC支持.曾经有个PA semi,最后Apple买断了. 还有xilinx FPGA也集成了IBM的4xx core,但貌似xilinx准备抛弃它了. Freescale应当是Power的主力军,如果它哪天倒了,那莫Power(ppc) 阵营也即将瓦解. Power在IBM也就是它的server/supercomupter在用,其出货量很有限.再说,IBM现在大量采用x86作为它的处理器. AMCC就不用说了,它的主力都来自IBM.没有完整的产品线,市场份额也不大.一句话,PPC的未来就靠Freescale了.

PPC太自大,不open.相反MIPS跟PPC不一样, 它的license模式比Power要强一百倍.不少公司license了,在STB, HDTV, networking还是有不小的份额.在相当长的时间了,MIPS ISA不应该会倒.(对了不是还有个ICT的Godson??? ), ARM是其最大的对手了.

3.个人很看好ARM的前景, 其商业模式和产品技术上都值得称赞. 它的ecosystem很庞大很完善.其规模不亚于x86在PC市场.
技术层面,arm汲取其他体系的精华, superscaler, mutli-core,.. (mutli-thread?)还有SoC bus. AXI总线(split, out of order)..
重要的是open….成打的IP基于ARM的总线标准.
intel要打败ARM还是很难. 个人觉得intel cash flow太多, 烧得慌!

4.NP专著与data plan, 目前高端市场固然有一定市场. 但随作 mulit-core GPU with network acceleration地加入, 和设备商的ASIC/FPGA for dataplan.
市场份额下滑是一种趋势。
# ALL IP？于 2009-06-06 5:53 pm edit

未来的处理器一定是谁的天下估计还是很难说的吧，从目前来看，Embedded处理器市场3-5年内应该是群雄争霸的时代，X86、MIPS、ARM、PPC都有一定的机会更进一步。

如果Intel真正打算向做PC一样来做Embedded的话，几年以后倒是很可能成为一支强大的力量，前提是Intel的处理器架构会为Embedded而改变吗

ARM在低端消费领域是无敌的，但要向上走，其成本功耗的优势还能有多少，还需要观察，性能要求越高，相对的对成本的敏感就相对低一些。特别是进入通信领域，可靠性要求越高。。。ARM任重而道远矣

NP最大的优势是灵活性，但灵活性也就决定了其技术的复杂性和可实现性，到目前10G/20G NP才比较成熟，而40G NP等了n年了都没有出来，100G就更不知道在哪儿了。。。在IP领域顶峰还是得靠ASIC+FPGA来搞定。NP在中低端市场还比较现实。但随着多核 CPU时代的到来，在这个领域NP和多核CPU（MIPS/PPC）有得争。。。
# ALL IP？于 2009-06-06 6:06 pm edit

不少大侠对Intel的IPX好像很推崇。据本人的了解，IXP12xx、24xx的市场表现还可以，可能很多安全领域的在应用。

而ixp28xx，则是一种无奈的选择，当时在10G NP市场也很是热闹，可惜AMCC半途而废、IBM不干了、好像还有一个Agere，但28xx好不好可能只有用它的人才有发言权。28xx其实本质还是一个5G的NP，10G还真是难为它了，cisco后来用它做了一个5G的处理平台
# cl 于 2009-06-06 6:51 pm edit

同意楼上的。。。
# 陈怀临于 2009-06-06 7:54 pm edit

得。这几天x86派的得势，MIPS选手不吭声了：-）。PowerPC的人马就没有出现：–（。
# ALL IP？于 2009-06-06 8:07 pm edit

怎么这么快就划分势力范围了，陈首席觉得在下应该是哪一派呢，呵呵

吐血敲了这么多键盘，没有入得高人法眼，几无响应，积极性都有点受挫的感觉了。。。。。
# 螺丝钉于 2009-06-06 8:31 pm edit

在通信和网络市场，我个人觉得可以从设备商的decision maker的角度看这个问题，他们不会太关注powerpc Core还是MIPS Core，重要的是SOC，是接口，是feather，是功耗，是die size，是内部加速器；如在存储市场，额外卖点在RAID接口, TOE功能等；在无线市场，额外卖点在SRIO, SNOW3G等；在网络interface Card，卖点在于接口(如XAUI， SPI4），保序，流原子， QOS等等；从这个市场看，并不是power跟mips的PK，而是cavium, rmi, freescale公司之间的PK.
# aaa 于 2009-06-06 8:39 pm edit

所以X86,ARM怎能一统天下呢？？？
不同的maket segment有不同的需求,
设备商的需求是多样的。
# aaa 于 2009-06-06 8:47 pm edit

die size设备商还关心？他们更关心money， price.

还有
* roadmap
是否有持续发展的能力。不会那天我量产时，你都关门了。
* 价格/供货
* 技术支持。
等等
# 陈怀临于 2009-06-06 9:03 pm edit

ALL IP,我一回到家就是看是否有讨论。你们的每个发言我都是反复看和想。自己也学习了许多。
我对IA32，ARM/xScale(4xx,23xx), MIPS(5K,7K)，PowerPC（4xx，7xx，74xx）都有工程级别的实战接触。这里面，我对xSCale是不太满意。换言之对IXP不太感冒。MIPS其实对系统软件工程师不太方便做大系统，特别是如果是32位系统。PowerPC和IA32不错。另外，我对EM64T，也就是x86的 64位计算看过一些东西，感觉很decent（干净）。

在最近的评论中，关于ARM要朝通信和高端设备上抢饭吃，是非常重要的，而且是在发生的。。。
# 螺丝钉于 2009-06-06 9:07 pm edit

die size设备商当然关心啊；比如无线市场，很小一块板需要放入一个多核cpu，多块dsp和fpga， die size也是很重要的； money, price, roadmap, 支持当然都是非常非常重要的，我前面的意思是一个当前产品的卖点，不是说公司的卖点；设备商选型当然是全方位的，我前面更多的是指产品这一块；
# aaa 于 2009-06-06 9:37 pm edit

那是package和pin的规模.不是die size.
# JackBauer 于 2009-06-06 10:49 pm edit

40G NP已经商用。
# KISS 于 2009-06-07 1:36 am edit

@陈怀临: 我挺ppc的－曾经吃饭的玩意 :_ )

@螺丝钉: 多谢解答。继续请教一下，如果core不是differentiator的话，从应用角度来说，目前要使设备商迁移到另一种处理器/SoC是不是不存在太大困难？另外，对于芯片供应商来说，那些接口，feature，功耗，加速器也不容易差异化吧？
# KISS 于 2009-06-07 3:05 am edit

看了各位大大的帖子，也凑个数，纯属抛砖引玉

从通用core/processor的角度来说，接下来五年内的竞争非常有意思，太长远的就算了－”The long run is a misleading guide to current affairs. In long run we are all dead”。个人觉得，x86和arm现在的位置都处于上升势头。因为都有killer customer，有volume可以支撑继续投入: arm统治mobile handset，x86是pc/server。而ppc/power的位置有待持续观察，mips的形势就不太妙了。

MIPS：商业模式跟ARM雷同，缺乏占垄断性地位的市场，消费类市场高端部分肯定受arm的侵蚀，通信市场受ppc压迫，还有新进入者x86。目前来看处理器方面有完备的产品组合(低中高端)，但一些MIPS vendor，如Broadcom/PMC等都不在core上继续投入了，而反观ARM，除了ARM本身，Qualcomm/Marvel等作为ARM的架构受权者都在积极推动处理器内核的研发。MIPS Technologies作为公司能不能生存下去我都觉得是个问题－最近买了chipidea又卖了就是个证据，他自己都还在寻找战略。实话实说的说，MIPS卖给ICT/Godson倒是个非常好的归宿－跟党走，大富大贵不一定，衣食无忧是肯定的，这样才可以保留一个“通用”处理器的名分。

ppc/power: 在部分市场（通信，Game Console，HPC）占一定统治地位，还有个强大的爹娘-但都三心二意。但各厂商之间研发重合，同样存在互相竞争。
IBM，嵌入式系列卖给AMCC－但却依然继续开发4xx系列内核，桌面处理器在apple那里被干掉了，服务器的POWER系列处于防御状态，mainframe也一样面临x86/IPF的进攻，而且他自身还有个强大的x86产品线。
Freescale作为公司也是有麻烦，基带部分没卖出去，公司除了占据较大市场份额的网络通信处理器，还有mcu/Arm-based应用处理器等产品线，在保证roadmap的情况下，通信处理器的统治地位短期内应该不会有什么变化。
AMCC的ppc好像是专注于storage市场？P.A.Semi有一个卓越的设计，但Apple买来就砍了。
随着市场环境的变化－arm/x86对处理器市场的渗透，各个ppc厂商都需要回答一个问题－能否保持足够的市场份额和收入来保证持续的研发投入？未来或许ppc厂商面临巨变-个人觉得成立power.org远远不够，”what if”整合成一家厂商?
顺便再搭车问一下：
1，FSL的e700是不是砍掉了？全部转到e500/e500mc？这个应该没有NDA吧，我记得2006年之前的FTF还有谈e700，2007年好像没说了，后面的FTF没关注了。
2，Xilinx嵌入405/440的FPGA主要是用在哪方面？系统厂商方面的对这种产品的感受如何？

x86: AMD几乎给不了Intel任何压力，本身已经自宫－”only real men have fabs”，如果本身的设计再出麻烦，生存都是个问题。所以Intel现在可以聚焦于“x86 anywhere”了，Intel在芯片设计和制造上的优势明显－领先6-12个月（？），技术上的两个短板low power x86 and SoC－目前有14款32nm工艺的atom-based soc正处于开发中（source: EETimes），针对嵌入式市场的software stack的软件链都正在解决中。接下来主要的PK，一是在mobile internet device上跟arm，虽说击败arm不可能，但占据部分市场份额是一定的。而且这一次必须要狠狠地打，应该是首要目标，也是接下来最大的看点。二是 GPU，x86-based Larrabee Vs NVidia。三是非MID的消费类电子，其中包括game console（这是个量很大的市场，如果赢了，可以烧掉ibm微电子的一个大粮仓了）。与上面一位大大提到的相反，在Atom上和TSMC的合作，并非不重视，而是一个战略性的举动，适当的时候可以将Atom直接授权给系统厂商（Atom的IP不对半导体公司开放的），抢占市场。另外，Intel的力量还不仅仅在技术方面，市场力量同样强大，Pentium 4可以说是一个比较失败的产品，但却依然是市场上一个成功的产品。但x86是否将通信市场视作tier-one目标就是一个问题了。

结论：long x86 and ARM, no idea on ppc, short MIPS, as general-purpose processor
# 螺丝钉于 2009-06-07 4:04 am edit

@KISS, ，个人觉得core不是differentiator，从应用角度来说，目前要使设备商迁移到另一种处理器/SoC应该难度不大，大公司一般会做一些多核支撑平台，减少各种产品差异性；而且迁移更多是工作量问题；当然如果厂商特有的feather，移植需要费点劲，如用到octeon的定时器功能，flow atomic功能的话，迁移到rmi上就需要使用软件或者换实现方法；
对于芯片供应商来说，那些接口，feature，功耗，加速器差异化技术上讲也容易互相学习模仿，但是市场的原因会有个继承性和一些取舍问题；比如从路标上看， rmi更侧重作更强的内核，更多的cache； cavium更侧重更多应用加速器； FSL更中规中距一些，没看到太多出彩之处； MIPS多核在安全，通信，存储等领域应该会有一席之地；
# aaa 于 2009-06-07 4:04 am edit

同意24层whoknows.

不能用PC的视角来看通信设备。
# aaa 于 2009-06-07 4:12 am edit

25层“NETLOGIC在国内的业务最主要就是hw/zte，他们需要大量使用tcam+多核处理器的方案，两个公司合并以后，可以给他们提供更好的解决方案和参考设计。”

1。问题是有多少RMI的核心成员能留下？
通常startup被收购后，人员会大量流失。
2。两家公司整合roadmap, IP merge也得需要时间。
hw/zte能等多久呢？
# aaa 于 2009-06-07 4:18 am edit

29层陈怀临
”
很热闹。我问一个问题。为什么？1.为什么x86更适合于PC和Server？但不能回答1说服我自己YET。”

个人认为,
1. 历史
2. 生态系统.
# aaa 于 2009-06-07 4:50 am edit

46层KISS
“x86在通信市场的看点不是Nehalem,而是将来基于Atom的SOC。…采用Atom之后，只怕每个通信处理器厂商都得紧张一下了。Intel的优势实在太多了－制造，研发力量，以及x86的低成本，但能否在通信市场成功还得看商务(business)方面的因素。”

我们不得不承认Intel有强大研发制造实力．但用一个in-order, single issue的atom集成tolapai的外设，很难想象它在网络通信市场能有多大作为．
# ALL IP？于 2009-06-07 5:36 am edit

@ JackBauer: 40G NP已经商用？方便透露一下吗。。。。
# ALL IP？于 2009-06-07 5:56 am edit

@ KISS：据了解FSL可能专注于e500mc了
# KISS 于 2009-06-07 6:07 am edit

补充一个有意思的说法：在80s-90s初RISC热潮兴起的时候，一度占据了server市场的很大份额，但pc上失败了，原因是：MS的OS代码较烂，而且使用了大量汇编，x86也较复杂很难移植到新平台，而服务器系统一般采用unix，代码很容易进行移植，RISC也很简单，所以小型机就挂了。
后来，随着x86的发展，同样是因为服务器上unix移植性好，而且risc也较简单，于是又转到性价比更高的x86平台了。

ps: IBM去年有一个防御性收购－Transitive，最著名的就是支持了Apple Rosetta系统背后的公司，专门用软件干这种事。
—————————————
很热闹。我问一个问题。为什么？1.为什么x86更适合于PC和Server？但不能回答1说服我自己YET。”
# aaa 于 2009-06-07 6:23 am edit

40G NP: Bay Chesapeake和Broadcom BCM88025/QE-2000都量产了．

Xelerated的HX330有望成为第一颗100G NP,
原计划2009 Q2 sample，不知道现在如何？
# KISS 于 2009-06-07 6:26 am edit

@aaa: 这里确实值得商量－free post，价值是free :_ ）
1, atom不是针对网络通信市场的核，主要针对ARM。而且intel如何看待通信市场，通信系统厂商肯定更清楚。
2，atom是多线程，从指令集效率来看，或许x86的single issue可以与MIPS的1.x issue相当－不过这得根据具体应用特性
3，从低端入手，得到volume，再向高端演进是很好的做法。至于x86会否有所作为，大家一起观察…
# KISS 于 2009-06-07 6:28 am edit

@ALL IP？：thanks。这么说来freescale短期内是不会有64bit的ppc了
# aaa 于 2009-06-07 6:35 am edit

大地址空间，大内存的需要越来越迫切，尤其在高端的系统．64bit core 是一种发展趋势．
Freescale不可能miss它．无论是叫e700还是e500xx,
64bit core迟早会上．
# ALL IP？于 2009-06-07 6:43 am edit

谢谢aaa！
我说的40G是指上行/下行都为40G，而不是上行+下行=40G。
QE-2000就是一个20G的TM，88025估计也是20G的吧，虽然提供了24GE+2×10GE接口，但实际上应该是收敛到20G，而且是以太，同时不知道性能如何？

HX330也是如此吧

—————————————
aaa 于 2009-06-07 6:23 am 40G NP: Bay Chesapeake和Broadcom BCM88025/QE-2000都量产了．

Xelerated的HX330有望成为第一颗100G NP,
原计划2009 Q2 sample，不知道现在如何？
# ALL IP？于 2009-06-07 6:49 am edit

确实如此！

—————–
aaa 于 2009-06-07 6:35 am 大地址空间，大内存的需要越来越迫切，尤其在高端的系统．64bit core 是一种发展趋势．
Freescale不可能miss它．无论是叫e700还是e500xx,
64bit core迟早会上．
# 大力水手于 2009-06-07 6:56 am edit

Xelerated的HX330，2009 Q2 sample，确实现在没有update了。100G的目标，基本上是cut-through，因为HX330内部ＴＭ只有50G能力的限制。
还有Ezchip 的NP4,估计也延迟了。
Bay Chesapeake基本上没有什么市场，Broadcom BCM88025/QE-2000在国内只有一个项目。
# KISS 于 2009-06-07 6:58 am edit

@aaa:
可据我所知，e500mc只是用一个传统FPU取代了SPE，最大的变动是增加了hypervisor支持。不过e500v2已经支持36bit物理地址空间了。
e700是一个64bit，4-issue(?)设计，流水也比e600长－一时找不到那篇文章了。
# KISS 于 2009-06-07 7:07 am edit

@螺丝钉: thanks
# aaa 于 2009-06-07 7:10 am edit

and…
e500mc

* 128KB backside L2 cache per core虽然个人认为少了点。

* CoreNet接口，这个很重要。

* new core to core signaling (msgsend/msgclr).

* 中断优化, interrupt proxy.

“e700是一个64bit，4-issue(?)设计，流水也比e600长”

pipeline长不是件好事.如何能达到主频要求.个人希望Freescale还能保持它的7段流水.
# 陈怀临于 2009-06-07 7:24 am edit

我会在美西时间星期天的晚上8点，将这次大家对多核系统，处理器方面的讨论整理出来，并且发文。

我觉得是非常好的一次讨论。

我个人对处理器接触比较多，也参与设计芯片。但感觉真是天外有天。你们说的许多我都不懂。

这就是集体的力量。
# ALL IP？于 2009-06-07 7:55 am edit

期待陈先生的整理结果，从前面各位大侠的发言中可以看出，很多人都是行内的资深人士，可能受限于职业操守和NDA的限制，在很多话题上不能深入透彻，但也可以看出不少有用的信息。

希望关于处理器的讨论能够继续下去，更希望早日能够用到我中华自主之处理器芯片！！
# matrix 于 2009-06-07 8:53 am edit

螺丝钉:
在通信和网络市场，我个人觉得可以从设备商的decision maker的角度看这个问题，他们不会太关注powerpc Core还是MIPS Core，重要的是SOC，是接口，是feather，是功耗，是die size，是内部加速器；如在存储市场，额外卖点在RAID接口, TOE功能等；在无线市场，额外卖点在SRIO, SNOW3G等；在网络interface Card，卖点在于接口(如XAUI， SPI4），保序，流原子， QOS等等；从这个市场看，并不是power跟mips的PK，而是cavium, rmi, freescale公司之间的PK.

===
这个我要顶，一看就是专家
# matrix 于 2009-06-07 9:03 am edit

1，大家对ISA讨论得很带劲。其实说白了，ISA之间的PK就一口水坑。同意KISS大大的引用—“从长远看，人都是要死的”，所以不太关心ISA之间的pk

2，我认为讨论一些更实际的东东则更有意义。上面的螺丝钉大大已经开了一个好头。各位大侠继续……
# matrix 于 2009-06-07 9:21 am edit

112楼陈怀临
“
得。这几天x86派的得势，MIPS选手不吭声了：-）。PowerPC的人马就没有出现：–（。

”
===
首席，
windriver都让intel给收了,这几天x86自然很得势了。

mips吧，就看rmi和cavium撑撑门面，自然势单力薄。

至于powerpc吧，fsl的兄弟老大哥做惯了，不屑讨论此类问题了。

(3个打分，平均：5.00 / 5)

工具箱
本文链接 | | 打印此页 | 62条用户评论 »

雁过留声

“多核系统与网络设备的大讨论”有62个回复

kunzhang3510 于 2009-06-07 11:26 下午

各位前辈,大家为什么只讨论硬件构架呢,要实现一个产品系统软件构架也同样重要,在下有一个问题,在很多多核网络安全产品中都提到control plane and data plane,比如linux OS 只运行在某个核上作control plane,其他核上用作data plane , 我的问题是:如何控制os只运行在某个核上(就是将所有的内核线程邦定到某个核上?),或者这些只是厂家的说法而已,谢谢!
陈怀临 于 2009-06-08 4:34 上午

在操作系统方面，如Linux，CPU Affinity是一个已经很成熟的机制，请阅读一下这方面的资料。
mj 于 2009-06-08 5:41 上午

从最近qualcomm和TI推出的SOC可以看出，ARM已经吹响了进攻高端市场的号角。
应用和需求为王，客户才不在乎你用什么架构。
zeroflag 于 2009-06-08 9:06 上午

不是做研发的，对CPU之间的优劣没法说清楚。但是我很清楚一个数据，我们用X86的CPU做一个200M性能的安全设备，其成本，比用RMI的8核作出的1.5G性能的同类安全设备，要高很多。功耗也要高出很多。而这两款产品的售价显然是后者要高出前者很多。

我想就这一点的区别，已经足够我们公司选择RMI而放弃X86了。事实上当初选择X86，也只是因为X86的硬件平台是现成的，可以快速出产品，而用RMI则要多一段时间才能推向市场。
老韩于 2009-06-08 11:26 上午

不认同4楼的意见，方便的话请举例说明，谢谢。
kunzhang3510 于 2009-06-08 10:10 下午

陈首席,我这方面的资料都看来并且做了试验,Linux CPU Affinity 是应用程序用的，应用程序通过这个可以指定自己在那个核上运行，我说的是OS，即所有的内核线程都RUN在某个核上，希望知道的前辈能指点一下，特别是做过基于多核的firewall的前辈。
zeroflag 于 2009-06-12 5:17 上午

回“老韩”：
具体的产品就不方便说了，我只能说这是一个真实的数据。
我不知道为什么很多人认为X86的CPU性能要好于MIPS的东西，我也确实不知道两种CPU究竟哪种更好。但是从我了解的一些皮毛来看，通信设备的典型运算都是大并发的。比如多线程的快速转发，使用RMI的8核CPU，可以并发32个硬件线程，我看到的实现是从5～32线程都是用于快速转发，也就是说27个并发的转发线程，X86的CPU性能再优秀，单核的运算能力能是RMI一个硬件线程的10倍以上吗？

我提到的那个200M的设备，采用的是双核的至强，成本本来就高，但是性能确实不怎么样。想想双核是8核32硬件线程的五分之一的性能，基本上就意味着，一个核的性能是对方一个硬件线程的3.2倍左右的性能，也不错了。

X86所谓的性能的优势恐怕是在浮点运算方面，而网络设备基本用不上浮点运算，那么这个所谓的优势又有什么用呢？

再从安全产品来看，国内大多数的安全产品都是X86架构的，从来没有出过真正意义上一对端口的小包千兆线速的产品。

所以，在我的印象中，X86做的通信产品都是低端产品。
ALL IP？ 于 2009-06-12 5:47 上午

7楼：拿X86做转发，真是难为它了，它根本就不适合干这活啊
Panabit 于 2009-06-12 5:59 上午

这个讨论越来越远了，建议评论之前将那篇有170+评论的文章的评论仔细看看。现在越看越好像在做X86和RMI或者CAVIUM PK了。BTW, zeroflag，你那个双核XEON只能做到200M小包的设备是一个什么类型的设备，是防火墙之类的吗？如果真是这样，从技术角度看，那个厂家估计该关门了，呵呵。另外，多核的转发，也并不是就可以做到完全并行的，你用RMI的话，在没有POE之前，你怎么着也得找几个线程做保序用，而这些保序的线程就会是瓶颈。这方面不能用厂家提供的那些passthrough例子来说明性能，因为这个在实际中就不存在，也没有什么意义。超过内存所能承载的核是没有多大意义的。
zeroflag 于 2009-06-12 6:54 下午

Panabit:
不是防火墙，是一个L4~7深度解包、还原、分析的东西。如果是防火墙，那也确实该关门了。
我不是研发，不了解保序线程的性能要求，不过从现有的处理来看，也确实只用了27个线程做转发。还有5个线程用于处理别的东西，具体是什么我没问过，里面应该就有您说的这个保序线程。

小小的debug一下，不是5～32线程，而是5～31线程。这里没有编辑功能，还真是麻烦呀！
老韩于 2009-06-12 8:58 下午

To zeroflag：我觉得您说的设备肯定有问题，应该越是4-7的东西，x86处理的优势越明显。最好能做个实际对比，我见过单路4核x86平台做应用层流量审计性能不到100MBbs，大量资源其实都用在数据实时编目索引和等待i/o响应上了。对您说的产品非常感兴趣
路人甲 于 2009-07-13 7:59 下午

FreeScale确实做多核方面动作缓慢，令人失望。但PPC的社区势力强大，而且随着IBM要开始与思科一绝高低，IBM必将发力在通信，存储，数据中心等等领域，从而与思科决战。因此，IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。
—————–
这一段有点问题哈，貌似Power体系的网络处理芯片现在都是Freescale在做，什么时候IBM来做了？IBM做得都是Power体系的服务器芯片，网络存储芯片吧。
路人甲 于 2009-07-13 8:00 下午

FreeScale确实做多核方面动作缓慢，令人失望。但PPC的社区势力强大，而且随着IBM要开始与思科一绝高低，IBM必将发力在通信，存储，数据中心等等领域，从而与思科决战。因此，IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。
—————–
这一段有点问题哈，貌似Power体系的网络通信处理芯片现在都是Freescale在做，什么时候IBM来做了？IBM做得都是Power体系的服务器芯片，网络存储芯片吧。
system 于 2009-07-16 5:22 下午

IBM做过，但是更让人失望，PPC已经开始淡出市场了，最终都会是开放架构的天下(ARM, MIPS)，除了x86
hehe 于 2009-08-02 4:44 上午

matrix 于 2009-06-03 6:41 pm
这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子，FSL ppc产品线.
KISS大大，对于以高集成度为卖点的SoC来说，难道我们只会关注它说采用的ISA?
# KISS.曹操于 2009-06-04 6:11 am edit

顺便搭车问各位大大几个问题：
1，从OEM系统用户角度看，FSL的e500比e600的优势有哪些，对于通信应用来说？
2，FSL的e700是不是取消开发了？QorIQ的roadmap里有没非e500的产品？
# 老韩于 2009-06-04 7:03 am edit

EP80579，简而言之就是性价比不高。我一开始觉得最有可能的应用是SMB级的存储，Netgear，Linksys之流可能感兴趣，可一直没有看到。

netgear是有在做这个产品，不过好象还没有完成设计
PPPoE 于 2009-08-02 4:17 下午

IBM做过，但是更让人失望，PPC已经开始淡出市场了，最终都会是开放架构的天下(ARM, MIPS)，除了x86
——————————————
powernp在同时代的产品中还行，原来有下一步的计划，退出是因为np的市场远没有达到它的预期，ibm的策略是一旦某些市场达不到她的预期，该产品线一般就会扔掉，所以用ibm的东西还是有些风险 :–)，已经转到hifn了，动静不是很大了。
“PPC已经开始淡出市场了” 远远没有，fsl销售很大一块还是这个，在高端工控，车载，基站等有不少应用，也有lisense core了。ps：mips现在日子可不好过啊，呵呵
kkk 于 2009-08-05 8:12 下午

怎么我感觉mips越来越开始上台阶了呢？
难道站的角度不一样
winux 于 2009-09-13 4:43 上午

其实Cavium/RMI如果真的成功、或曾经那么接近成功的主要原因，就是他们致力于这片细分市场。他们用了体系较为开放的mips，再在内部总线、网络包的预处理、核间通讯等方面做了一些很有创新意义的工作，Intel为什么不做？也许不是它不能做，而是它确实没有时间顾及这片市场。

可惜这个市场也不是那么容易做的，基于多核的产品开发，似乎都有点雷声大雨点小，似乎做安全的用Cavium比较多吧，国内用RMI也不少，RMI在北美的代表客户，Juniper，也一直没做的怎样，这些大客户们没给RMI肉吃，RMI没办法了，只好投身Netlogic，可惜了，但也许不是坏事，呵呵。

如果Intel真有一天醒来要做这个东西，，，，，，偶觉得这个假设就一边去好了，回忆一下Intel怎么斩去网络通讯部门的吧。倒是Freescale如果醒来的话是很恐怖的，不过，就F公司退出双核的速度来看，人家似乎对此不是很感冒。

所以，未来留给Cavium/Netlogic(RMI)的想象空间还是很大的。

偶看楼上好多人在讨论ARM、MIPS、x86的未来，呵呵，别讨论了，技术牛不一定是最后的胜者，要看市场。
winux 于 2009-09-13 4:49 上午

写错啦，不是说freescale退出双核，是推出
李克于 2009-09-15 1:29 下午

应用决定系统,系统决定硬件,有些结论是比较基本的
ASIC:商用已经超过40G,最不灵活,性能最强,JUNIPER最狠,其可编程ASIC还是很牛的,但如来如何,其核心技术是高性能和在一定程度的可编程,请灵活性及其有限
NP:商用为20G,40G还在路标中,是微内核,性能被ASIC差,但灵活性类似CPU,但代码空间极小,代码都在内核中运行,难以处理复杂的L4-7层业务
多核CPU：商用10G,但10G时处理业务有限,所以需要同时叠加多片,此类CPU如果能做到代码很小,完全在CACHE中运行,那么其代码空间和NP类似,当然性能也类似,但多核CPU的定位不是NP,所以不会这样用,目前处理L4-7层业务,包括防火墙,DPI,视频等比较理想,目前因为核心路由器的控制层面负载越来越高,包括包处理,虚拟路由器,逻辑路由器,NSR等需要,采用多核CPU已经是基本趋势
通用CPU:各路大侠分析很深,不必多说,目前看不到适合做高性能处理,当然目前多核的通用CPU有上面MIPS多核有一定的相似性,目前有一些试点做路由器类设备的控制层面
至于ARM:大侠们也都分析得很清楚,适合小型的移动和多媒体设备等,目前还看不到在10G级高性能业务使用的规划和前景
上面的各类,基本定位明确,彼此间冲突较小,但在系统设计时,在兼顾行性能和灵活性的情况下,如果把主控板和各类接口卡也放在一起考虑,这样一个复杂的系统包括了:ASIC+NP+多核CPU+FPGA+单核小型PPC/MIPS CPU.可以想象,这样的一个系统设备,有多复杂,代码行数进千万,其压缩后的bin文件(image)超过100M,人力投入以千计,开发管理从IPD,CMM到敏捷开发,这个门槛相当的高,在国内H在第一档次,Z在第二档次,其他的各自在自己的专有领域里做问题不大,但进行这个级别的系统,不需要也不能.但是,要知道H的硬件的平台是通用的,这个平台出来后,被免费用在其他业务平台上,结果对其他业务领域造成很大的冲击,但是H对其他业务领域业务本身的理解有限,并不一定有这些业务领域的领先者高,所以H在进入这些领域好,还没能很快的爆发出力量,但是以后会怎么样,很难说,看吧
wxh168 于 2009-10-14 6:08 上午

楼上谈论了很多CPU,但我认为一个很重要的东东大家都没有谈：就是DSP,DSP目前在通信/图像处理等系统中用的非常多。
有人说嵌入式系统复杂，掌握起来困难，我看DSP更复杂，上面没有操作系统，基本上就是自己做一个微内核来编写，调试也极其困难。
啥时候Linux能在DSP上跑呢？
另外多核CPU能否战胜DSP呢？
陈怀临 于 2009-10-14 8:08 上午

有意思的话题。我想想。。。。是的，其实多核首先是在DSP领域铺天盖地的。。。。。。。wxh，现在DSP上run什么rtos，或者大多数是自己inhouse写的？
李克于 2009-10-14 1:00 下午

DSP早时内置用小的RISC CPU，后来为提高性能有用小型NP和多核的。DSP以前用PSOS的有，不知道现在流行什么了。DSP的商业开发的调测，确实是不大好搞，导致复杂问题的定位很烦人，操作系统是一个问题，还比较麻烦的是它作为一个大系统的一部分，难比较独立的调测系统比较难。不大懂，随便诌几句
求求首席，删华为贴吧 于 2009-10-14 3:31 下午

陈首席及诸位高人：
指令集的设计如何入门呢？（有了基本mips的基础了）
moto.lj 于 2009-10-14 5:14 下午

一般都是厂商的私有的RTOS，作为一个库提供，通用型的不多见，这玩意更注重高效的算法，一般都比较简单精炼。
陈怀临 于 2009-10-14 5:28 下午

设计指令集？？想干嘛？！：-）这东西我干过。不容易。。。
通常，你是这样的一个思维逻辑：RR模型。如果不知道什么意思。请不要继续往下读。

然后要知道一个ISA要有I-type， R-type，J-type等。这些都还比较容易设计。。。

比较复杂的事中断的处理。这方面是往往你们“具有基本MIPS基础”的大牛们没想到的。。。。。。
对一个中断指令的设计，这里面涉及的问题就很多了。。。。。。

总之，没事玩这个干嘛？？？现在流行的是写iphone app，android！
Forrest 于 2009-10-14 9:13 下午

TI 的DSP是自己的一个微核BIOS，只有任务调度。不过用起来感觉很好用。
帅云霓 于 2009-10-14 9:47 下午

[对一个中断指令的设计，这里面涉及的问题就很多了]
是不是指的这么个问题：
在返回的时候要同时做两件事情，一是恢复原来中断的那条指令，二是同时把特权级从kernel切回到原来的状态。否则这里就是安全漏洞。
moto.lj 于 2009-10-15 2:56 上午

[对一个中断指令的设计，这里面涉及的问题就很多了]
是不是指的这么个问题：
在返回的时候要同时做两件事情，一是恢复原来中断的那条指令，二是同时把特权级从kernel切回到原来的状态。否则这里就是安全漏洞。

估计还有流水线相关的问题…
wxh168 于 2009-10-15 5:05 上午

Forrest 说的对，基本上是DSP厂家提供了一个微内核，大概几百K.

我是1周前才找到tektalk这个好地方的，这几天看了这里的文章，发现对数据通信讨论的比较多，但对于语音通信谈的比较少，希望能补充一下探讨。

目前MGW的业务量还是很大的，但玩家很少，基本上是ERIC/NSN/ALU/H/Z这几家在玩。

MGW的设计要求也很高，目前大部分厂家是采用DSP来做媒体处理，基本有两种方式：
1. 拿芯片厂家的DSP,设备商自己做算法；
2. 芯片厂家提供DSP,并集成算法进去；设备商直接使用。
方式2的开发难度要小一些，但受制于芯片厂家更多一些。

目前各DSP芯片商的Roadmap也是采用Multi core的，例如TI的6486，是6个核；

同上面的各CPU相比，我认为DSP的开发调试难度最大，主要是DSP的开发受制于如下几个因素：
1. 内存，每DSP的L2 CACHE通常是几M,片外RAM几十M;
2. 调试，缺乏开发工具，调试极其困难，特别是内存越界问题，极其难查；

目前有个疑问：
1. 既然大家讨论的X86,ARM CPU未来发展迅速，能否替代DSP? 这样会大大加快开发速度。
2. DSP实现的事情，采用FPGA/ASIC是否也能做？有先例吗？（主要是目前采用DSP做的系统集成度低，想尽一步提升）
wxh168 于 2009-10-15 5:08 上午

另外，上次和TI工程师交流，他们收购了一家小公司，准备在下一代DSP上跑LINUX;

不过，我认为DSP内存空间如此小，LINUX内核能放进去吗？
Forrest 于 2009-10-15 6:05 上午

现在TI的Davinci系列（双核），ARM side一般就跑Linux，DSP side是BIOS。
陈怀临 于 2009-10-15 6:15 上午

29,你说的很对。在设计异常处理（Exception）指令时，事情就变得复杂。设计指令，其实就是在设计一个处理器的微结构。而不是一个处理器已经设计好了，再来设计指令集。

通常而言，通信公司的ASIC工程师没有能力做CPU。是不同的expertise。即使能做一个简单的NP。但一定是非常简单的。clcok很低。如果封pipeline，但其实复杂性估计不然Berkeley CS和EE的作业难。

你们别笑，80%的工程问题，从难度而言，其实没有美国top5学校的大作业难。
陈怀临 于 2009-10-15 6:29 上午

“我是1周前才找到tektalk这个好地方的”

很高兴您这样appreciate我们。这就像美丽善良的女子，往往不是在烟花酒巷出没。你我行走江湖，其实念着的还是那盏万家灯火之中的温馨。

你不是喜欢《弯曲评论》，你喜欢的是温馨：-）
Forrest 于 2009-10-15 6:58 上午

你我行走江湖，其实念着的还是那盏万家灯火之中的温馨。

首席这句话说得太好了。

深林人不知，明月来相照。这句诗送给tektalk.
spike 于 2009-10-15 8:09 上午

“你不是喜欢《弯曲评论》，你喜欢的是温馨：-）”
首席真是与时俱进啊，呵呵

“你们别笑，80%的工程问题，从难度而言，其实没有美国top5学校的大作业难。”
能否写篇文章单独介绍一下这些个大作业都是什么样的？
陈怀临 于 2009-10-15 8:12 上午

Heeee. 是，我这人其实挺八卦的。。。
JackBauer 于 2009-10-15 8:20 上午

VOIP网关很成熟了。
前些年倒是有自己写代码实现算法的，不过那也是为了向IC供应商压价。
固网产品里面，DSP工程师已经消失的差不多了。
帅云霓 于 2009-10-15 6:06 下午

其实国内TOP20的大学大作业难度上来说也不低，只是抄袭风气非常严重，我在大学时代亲眼目睹过这些事情，每个班的作业都只有一个版本。
据说在米国高校，这种事情的性质被认为很恶劣，甚至会导致被学校开除的后果？
guoke 于 2009-10-15 6:28 下午

我记得上学的时候，就听说高中同学形容说南开物理系专业学起来很累，能把人逼疯跳楼，精神失常，做习题一天解出半道题都很激动，不知道现在90后如何上大学
Forrest 于 2009-10-15 7:00 下午

确实是这样，记得当时我们班作业有两个版本，男生一个，女生一个。可以说制造作业范本的同学对其他同学顺利毕业做出了巨大的贡献。
wxh168 于 2009-10-15 7:35 下午

To JackBauer:

目前Codec的IC供应商基本上是那些DSP厂商吧，实际上是DSP厂商扩大了产业链，代替设备商把算法做到DSP内部了。

我是想问，是否能采用ASIC/FPGA实现这些Codec算法呢？这样性能不是更高吗？
wxh168 于 2009-10-15 7:36 下午

类似于IP域，

DSP类似于NP和多核，

但其性能还是无法和Cisco的SPP和QFP竞争的.
路人甲 于 2009-10-15 9:11 下午

to wxh168 : 可以采用ASIC和FPGA来实现，但是采用DSP实现主要是为了设计的可重用性。一次流片可以保证数百个应用。其实DSP这玩艺，并不一定要它和处理器的融合和集成，更确切地说，DSP更多地是工作在数据平面:)。

呵呵，有些声码器的厂商，自己直接卖芯片，但是他卖的芯片，其实就是固化了自己算法代码的TI DSP，只不过芯片表面打上自己的logo和型号。
帅云霓 于 2009-10-15 9:43 下午

[不知道现在90后如何上大学]
有一次跟我大学时的辅导员，现在的学校学生处一领导聊了聊，他说，现在小孩没几个像我当年那样对科技社团的活动如此狂热(可以整夜整夜摆弄单片机)，都热衷于志愿者、街舞大赛，歌唱选秀这些事情。对于实践性强的大作业，已经从每班一个版本退化到了每个系一个版本…
wxh168 于 2009-10-16 3:27 上午

To 路人甲：你的理解正确，其实从ASIC -> FPGA -> DSP -> 多核 -> x86 CPU,

性能是逐渐下降，但灵活性/通用性逐渐提升的。

比如今天我收到Intel给我的评估报告，采用最新的CPU： 4个Nehalem内核，2.13G 60W, Suse Linux, 处理AMR codec只能达到2000路。

也就是4片6486的水平。

关键是专用系统中，对功耗约束很高，对性能也要求很高，DSP都搞不定，因此我想问问是否有人用ASIC实现Voice或Video算法的，性能如何？
aaaa 于 2009-10-16 4:26 上午

ASIC实现voice transcoding… 真扯淡…
aaa 于 2009-10-16 6:24 上午

asic现在都流行集成dsp了
arm11 /mips 24ke已经有了部分dsp指令
最好的表现还是dsp
路人甲 于 2009-10-16 6:56 上午

to wxh168 : 或许你可以评估下FSL MSC8156，45nm工艺的，虽然MSC8156是为无线宽带专门设计的，但是其运算密度基本上是6486的两倍。6486有些老了，还是90nm的工艺。为Core network Transcoding设计的DSP还有LSI/Agere 的SP2612。
路人甲 于 2009-10-16 7:24 上午

to wxh168 : 2000路AMR貌似要8片6486吧？
XOC 于 2010-03-22 8:37 下午

看到各位高人在讨论多核DSP，想请教几个问题：
1. 现在DSP中的程序很多用汇编编写，那么多核DSP的程序的开发模型应该是什么样的？虽说这要根据应用来看，但多核DSP的编成模型从总体上应该有值得提炼的地方，即应该有别于多核CPU。

2. OpenMP是否适合多核DSP的程序开发。

3. 多核DSP是否一定要提供BIOS.
metal1011 于 2011-05-22 6:53 上午

mark
thunder1814 于 2011-05-22 9:09 上午

mark
multithreaded 于 2011-05-22 8:13 下午

2. OpenMP是否适合多核DSP的程序开发。

Answer: NO. OpenMP is too heavy for DSP application

3. 多核DSP是否一定要提供BIOS.

Only X86 requires BIOS
陈怀临 于 2011-05-22 9:41 下午

如果有人在贵公司内部胶片提议玩OpenMP，你们应该当初fire 他。马谡误国。
一条虫 于 2011-05-23 4:45 上午

啊。。不会吧。俺刚拿OpenMP的benchmark用来多核选型。。不要fire俺啊。。首席你太狠了。
陈怀临 于 2011-05-23 7:47 上午

选型做benchmark可以。但不要用之写release product。
BULL 于 2011-07-31 7:21 下午

认识这个地方真好，
路人王 于 2013-05-07 3:52 上午

过几年再看这个贴, 可以证明哪些观点是对的, 也可以看出谁在裸泳.
laotuinbay 于 2013-05-09 2:37 上午

老土是第一次看这个几年前的讨论。没看完。很多内容多有娱乐。说明首席开的这个讨论好啊。这几年发展了，不太一样了。PC麻烦了。intel还没回过气。ARM更大了。大家都用ARM多核soc了，big-LITTLE了，ARM64roadmap了，双核，四核，八核多了去。MIPS哪去了。Tensilica找靠山了。Tilera还在，前途茫茫。Loongson还在玩吗？低端ARMSOC在天朝和天朝台湾（Andys）枪地盘，好像有点气势。处理器与tool chain绑得更紧了。编译器不好，处理器必完蛋。要玩多核，看看GCC或LLVM支持啥，你就用啥，错不了••••••
laotuinbay 于 2013-05-09 2:55 上午

16 nm FinFET semiconductor 年底量产。10-7 nm 技术也快了。不过，天朝不用担心。超前技术多赔钱。别人出钱出力做好了，成熟了，风险小了，立马跟进，快速赶超，错不了••••••
aa 于 2013-05-19 8:51 下午

这几年安全行业感觉发展的不是很好，玩得东西变来变去，但是市场不见大，挣钱途径很有限，竞争更多体现在销售互相欧打。追求产品更高更快更强的公司打不过靠关系拉单的公司，追求什么技术，做最好东西，恐怕很多公司都看透了，不再感冒这个了。专注技术的人，或者早早转行，才是明智之举。
而从国内大环境看，这个行业是越来越冷，暮气沉沉，合并多，新生少，投资这个行业的人，基本深度套牢。赚钱的日子是遥遥无期的。

最新用户评论

最新文章

分类

多核系统与网络设备的大讨论

雁过留声