多核系统与网络设备的大讨论
作者 陈怀临 | 2009-06-07 21:00 | 类型 专题分析, 弯曲推荐, 通讯产品 | 62条用户评论 »
在《弯曲评论》发表了NetLogic买断RMI的文章之后,得到了许多读者的关注,并引发了对多核系统微处理器的热烈讨论。其中讨论的话题有:RMI的前途,RMI与其竞争对手Cavium的相关比较;后来话题扩大,读者开始讨论:x86架构,MIPS,ARM,PowerPC等在通信设备领域的优缺点。在讨论中,读者的评论中涉及打大量的最新技术和体系结构。笔者对每个评论都做了详细的阅读。并将安排自己的时间做相应的阅读。 关于多核系统,各种ISA体系结构方面,笔者在这方面的经验和思考是这样的。 应用系统决定论: RMI与NetLogic: 简而言之,是MIPS多核+TCAM的组合。 TCAM是各大通信公司,特别是路由器公司的七寸。你算法再好,你也得Lookup快不是。读者可以试想下一代RMI的XLR或者XLP芯片有了TCAM的接口(Interface)。有兴趣的读者可以阅读笔者撰写的“思科QuantumFlow处理器及其战略研究(7):体系结构(报文观点)”从而比较思科的QuantumFlow网络处理器的体系结构。从技术上而言,RMI与Netlogic是一个非常不错的整合。 MIPS的问题: ARM朝高端系统方向发展: PowerPC的落后: IA32和EM64T的野心: 当然,上面都是笔者自己的一家之言。有兴趣的读者可以详细阅读众多评论如下。
# Sunny 于 2009-06-01 5:18 pm edit ”估计RMI的员工基本上不可能挣什么钱“ 老陈真体恤民情呀! 团队是fabless的根本,团队要散了,就啥都没有了。 观察XLP和XLR,从网络的角度,最大的就是加了一个POE–Packet Order Engine。可以回顾一下Cavium芯片。。。我个人非常认可这一点。否则,拿软件做Packet Ordering,高端系统确实不好做。 应该说,XLP最大的变化是对CPU核的增强,据说单个XLP核,在同频率下较XLR性能高一倍以上 很想知道XLP的POE的详细参数和细节。不知道同Cavium的SSO比,有什么特点。 XLP vs. XLR 2.POE(packet of order)引擎的引入 3.接口的变化.XLR算是10Gbps方案,XLP则是40Gbps方案。XLR support 2 XGMII/2 SPI4,4GMAC,HT.XLP support Interlaken(40Gbps),XAUI(40Gbps),pcie(16lane,2.0) 4.支持4片XLP芯片间full mesh互联(inter-chip-connect,ICI),并保证跨芯片cache一致性和芯片消息环(Fast message network,FMN)处理一致性,用于高性能计算和100Gbps 据说RMI的每个员工都有不少股票,这次他们能够赚不少钱了吧! 个人认为XLP内置的RAID5、6运算加速是重点。据说RMI行业收入的最大头是存储,存储无处不在,相比之下通信和安全太小了。而未来的存储一定是IP 的天下,XLS已经做到了TCPOffload,加上丰富的接口和PCI-E 4x,做HBA没有问题。现在XLP再一出来,做存储控制器应该也没问题了。 通常而言,RMI完了。Game Over了。如果对投资有兴趣的话,可以考虑购入Cavium的一些股票。当然,我的意思你如果你觉得投资这个sector有兴趣。 可怜的RMI,事件是无情的,不知道Cavium会怎样 ”估计RMI的员工基本上不可能挣什么钱“这句话应该是对的。据说RMI在中国的团队比较大,我想接下来就是裁员了,在中国! 本人接触过RMI的中国的技术支持,大部分都是从华为、中兴和当年的华三出去的。这些技术支持的技术能力还是很强的,RMI在中国凭借着支持团队优秀的支持能力战胜了Cavium,进入了无线、安全以及数通领域。 相比之下Cavium在中国市场的技术支持能力比较弱,在中国没有战胜RMI并不是因为的多核处理器本身,而是因为他们没有注重本地技术支持。 XLP能搞定的事情,我相信Cavium的多核处理器肯定同样能够搞定!只是我们关心的是使用哪一个会更容易,更迅速的产品化,那就不得不考虑本地支持能力。 Game Over了,也许这是Cavium的一个机会,在中国战胜RMI的好机会。他们裁员你就招人,用这些人重新占领。呵呵,看来Cavium的股票要涨价了。 这次收购RMI的员工可能要倒霉了,从技术上来说RMI比NetLogic强的多,也更有发展, 但是运营是Netlogic的强项。 老板是很爽的,但是RMI下面的员工恐怕股票要打水漂了。 我从RMI的结局,也在思考龙芯的命运。RMI的创办人和团队的技术实力与计算所打个平手应该不为过吧。你胡伟武为了中华民族复兴:-),RMI员工做 startup为了生存与活命。不应该说人家工作不勤奋。这么多的account(客户),但volume上不去,结局仍然是这样的黯然出局。 龙芯,以MIPS ISA为起点,以Linux做宿主操作系统结果目标却是通用计算机和家庭上网本。即使龙芯3流片成功,x86指令系统能虚拟化成功,但到底市场在哪里?除了曙光,谁是买家? 我个人目前持谨慎乐观的态度。 呵呵,龙芯!又是一个打着民族旗号的产品。大跃进式的工作方式。 掂量出自己的分量,给自己合理的定位应该是做事情的首要解决的。难道像大跃进,喊亩产万斤,难道你的一亩山坡地就真能出产5000斤了? 我倒是佩服珠海炬力这个公司。 cavium下一代的处理器是65nm,这是他们致命缺陷。从投资角度来说,合并后的netlogic/rmi都 我相信通过这件事情,那些一心绑定在RMI或者CAVIUM上开发自己产品的二三线网络安全厂家就要仔细考虑了,这样的风险是否是自己可以承受的,也许,X86会重新抬头。 我同意Panabit的观点。特别是Intel的最新微结构Nehalem之后,x86确实很好的架构了。 我还是不看好Cavium,他们和XLP对应的处理器最快也得明年才能出来吧。通过RMI这件事情,会有很多人发现,X86可能更可靠(综合);同样,也会有人意识到自主知识产权处理器的重要。 hw,zte他们非常欢迎这次合并,这对他们是有好处的,因而,这次合并对cavium非常不利。在电信设备/网络设备市场,x86架构未来几年之内都没有机会。从接口丰富程度,从功耗来说,x86都相差太远太远。 whoknows应该改成Iknow。连华为与中兴很high这次合并都知道:)。圈内人呀。希望多让华为或者中兴的弟兄们访问弯曲评论:-) 我怎么听说很多华为的人已经开始唱衰这次贱卖了,而且听说RMI的很多员工已经开始跑路了,真是树倒猢狲散啊 就目前的技术层面而言,除了通用处理器是国内掣肘外,其它像POE或者局部加速的技术,国内都可以实现,因此,完全可以利用我们自身的技术,再加上X86等功能强的CPU来做一个系统。可以利用X86换掉RMI或CAVIUM的MIPS CORE。功耗方面,在高端系统,X86没有明显的劣势。至于你所说的接口丰富等方面,完全可以有外围硬件替代。另外,从长远角度看,对数据包做更高层次的检测室大势所趋,所以,数据包都经过通用CPU,而不是目前的防火墙所简单的SLOW/FAST模型,这也意味着需要功能更强的通用CPU来实现。还有,目前X86的外围网卡和芯片组已经做了很多方面的工作,比如Intel宣称的IOAT技术,就已经在网卡里增加了RSS来作为LOAD BALANCE,增加了DCA技术来将数据包DMA到内存的同时,加载到CACHE里,这些都是可以显著增强数据包处理性能的特性。 哪那些绑定在多核上的topsec,leadsec不变得前途未卜了啊? HW,ZTE欢迎这次合作,这不太可能吧,这哪是一个积极信号,看看CISCO同这些公司的关系,难道不心存忧虑?我倒是觉得将这看着一个警钟比较好。至于国内那些将自己的全部产品线押宝在CAVIUM上的,就更加要注意了。CPU,还真是国之重器呀! Panabit 没有真正去了解过电信网络设备领域这个行业,还在用PC领域的眼光去看问题。SOC为什么可以在网络设备大兴其道,整板成本是关键:不光是外围器件的数量可以上,加上PCB布线生产加工的难度降低。 btw,你说的intel哪些功能,cavium/rmi/freescale的芯片上都已经有了,而且在市场上卖的产品都用上了,不仅仅是一个概念而已。 员工跑路是可能的,但是,对于电信设备制造商来说,对他们是利好而不是利空。NETLOGIC在国内的业务最主要就是hw/zte,他们需要大量使用tcam+多核处理器的方案,两个公司合并以后,可以给他们提供更好的解决方案和参考设计。 功耗方面,在电信设备上的CPU是不能有风扇的。就一点你就想想跟x86架构功耗差别有多大。何况cavium/rmi都是soc,里面还集成了很多其他的接口和引擎,整版功耗比x86方案不只少一点两点 对于 OEM 厂商来说,应该是利好。说明 RMI 稳定了。 对于 RMI 员工来说,不做评论。一切皆有可能。 RMI 的技术值得尊重 现在那个电信厂家还在使用x86平台? 但是听说Z公司核心网使用的是x86,但我们从来不用x86,x86适合PC但不是和嵌入式这个领域。 x86好好做pc吧! RMI不知后续如何?XLR/XLS不以后知是否还能像今天这样风光! 很热闹。我问一个问题。为什么? 1.为什么x86更适合于PC和Server? 我个人认为我能回答2,3.但不能回答1说服我自己YET。 现在那个电信厂家还在使用x86平台? .为什么x86更适合于PC和Server? 还请说说看 各位千万别误会,我并没有说X86用在电信核心网。我主要是针对国内现在的二三线网络安全厂家所做的评论。另外,Juniper等已经在走通用处理器 + ASIC的模式了,只不过用的不是X86,而是PPC等。另外,要以发展的观点看待问题。X86现在的架构已经解决了IO问题,这正式发展自己的外围 ASIC的好时机。 试回答陈首席的三个问题: 不妥之处还望各位大侠指正。 我期待大家的讨论。我看一下大家的讨论。对Panabit对系统的理解比较欣赏。能说出x86解决了I/O问题这句话,说明确实有点功力:–)。是个搞技术的好苗子。也希望其他华为的同学们看看Nehalem的介绍。 当然,并不是说Nehalem微结构可以做NS5000E的Forwarding了。只是说,事情都在悄悄地演变着。。。。。。 首席对 Netronome的NFP32XX,EZchip的NP3,以及多核,有没有相关的比较,比如针对路由器这种应用,谢谢 X86的IO问题,我觉得根源在其体系结构,X86属于CISC,但演进到P3/P4时代实际上用RISC+微码来实现,这样造成内部晶体管数目和面积膨胀,放不下更多的I/O附件。(不能和RMI那样的SoC比啊) 补充上面的: “x86解决了I/O问题这句话,说明确实有点功力:–)” === 2.x86平台的功耗问题,一直让人头疼。高端的至强平台,功耗到100w+,客户单板设计相当头疼。不说100w+,就是50w,现有客户都抱怨不断! RMI是一家技术导向型公司,从多线程到现在的4 issue等都体现了追求技术决心,但其在芯片内部实现了这些东西固然有其好处,但是考虑一下功耗,成本,据了解RMI给客户的芯片都是LP版本的,die size都很大,成本相对都比较高。 公司毕竟是商业的,完全追求技术路线的公司很难取得最后的成功。这方面,感觉RMI输给CAvium。 再论功耗问题,freescale一个宣传策略:30w功耗作为嵌入平台功耗的分界线。肯定是有一定道理滴 有没有介绍下Freescale的PowerPC平台特点的 想不到我关于X86的一序话居然是丢下了一颗炸弹,呵呵。 intel Ep80579 二三线网络安全厂商也会转RISC平台。台湾传统工控板厂商都在积极开发和推行cavium/rmi的中低端的标准板。x86平台在网络设备上的可应用范围会越来越窄。 网络设备这个行业的生态跟传统的pc/server 完全不一样。 看了很多评论,发现很多人的理解还是很肤浅.X86有它的优势也有缺点.至少在通信领域,嵌入式以MIPS和PPC为架构的多核处理器还是主流,这里有很多原因,功耗,BOM成本,IO接口,IO处理的能力,多核配套软硬件环境,IO处理能力,任何一样,X86目前都没有优势,X86的计算性能,我做过和 RMI,OCTEON对比,基本上如果同主频,OCTEON的CORE和X86一致,RMI的CORE设计相对性能较差(10级流水线,单 issue).RMI的下一代,应该讲从路标的角度讲,要比OCTEON的下一代更吸引人,多issue,多线程,加入类似OCTEON硬件保续单元等等,基本上在保留自身特点的基础上把原先OCTEON的优点都抄袭下来了.就是具体的流片时间要人担心,另外功耗也是一个主要的问题,而OCTEON的下一代相对应该更可靠,基本上只是升级工艺,更多的内核而已.现在市场上,不是你画个图给大家就可以,推出的时间点,稳定性都很重要.目前从纯计算的角度讲,如论是RMI还是CAVIUM,相对于X86也并不吃亏. 1,这个价格是不是贱卖不一定,现在的形势太差了,IPO基本无望,投资者退出无门,合并是一个不错的选择。合并(Merge)后如果整合成功,RMI的前途或许更光明,至少投资者看好-$NETL随着消息的宣布上涨10%+, $CAVM这两天倒是在跌。同样是上周,另一家MIPS厂商SiCortex,虽然增长势头很猛(HPC市场)-但没有新的投资进来,不得不宣布变卖资产,停止运营了。 2, x86在通信市场的看点不是Nehalem,而是将来基于Atom的SOC。上面kkk提到了Intel去年发布的EP80579,这个是Atom之前的产品,基于Pentium M “Dothan”内核的单核SoC,这个芯片TDP在11w-21w之间,90nm工艺,主频600M-1.2G,集成度丝毫也不亚于其他通信处理器。采用Atom之后,只怕每个通信处理器厂商都得紧张一下了。Intel的优势实在太多了-制造,研发力量,以及x86的低成本,但能否在通信市场成功还得看商务(business)方面的因素。 3, US半导体初创公司的美好时光已经一去永不复返了,尤其是处理器公司,再也不要想有QED那种几十亿美金的收购案了。希望在东方……:) 结论: no idea on RMI, long Intel. My two cents To Panabit: ft 系统的AI智能决定是否审核:-)。可见机器人永远不能战胜人。 tektalk明天也系统维护吧。 atom性能太差,而且intel都将其生产外包给台积电,可见其在intel中的地位。 intel在通信市场近期难有作为,即便是传统的防火墙厂商(topsec/网御/网神),他们也都认识到了这个问题,正在积极转型。 EP80579是比较失败的产品,自身不过硬,又在错误的时间出现,天时地利人和都不占便宜,据说到现在几乎没有国内安全厂商采用。平心而论,我认为那个平台还是不错的。 “x86的I/O问题是个什么问题?是指FSB?PCI-E等也只属于系统结构层次吧,跟ISA是不是x86没关系.” KISS大大,对于以高集成度为卖点的SoC来说,难道我们只会关注它说采用的ISA? 看看这些 寒冬呀,日子不好过。 我觉得,从RMI被贱卖这件事情,看到的不是对谁有利亦或不利,而是一个信号,就是一个我们产品所依赖的第三方是否稳定的信号。我们可以想一想,如果当自己的产品线全部采用RMI或者CAVIUM的时候,一旦出现不稳定的信号,自己是否可以承受。当然这个能否承受与否,是因公司而异的。我并不是竭力推荐 X86,我只是说,X86同以前相比,已经有了很多积极的变化,而且这种变化还在持续下去,比如最新出现的i7,其QPI,总线方面,PCIE 2.0的支持已经多通道内存的支持,这些都是积极的变化。从CPU的角度看,X86无疑是强劲的,当然接口肯定不能同通信处理器相比。不过我认为,如果厂家自己有能力丰富接口而弥补这些不足,X86倒不失为中高(高-)端安全产品一个较好的选择。现在的安全产品有一个趋势是朝应用层发展,这也对更多的 CPU处理能力提出了要求,X86在这方面无疑是有优势的。至于matrix兄,陈首席可不是在损我,你要相信这一点,呵呵。大家都在以自己的经验去看待事情,有时不妨适当跳出一下自己的圈子,呵呵。 回KISS兄弟,我说的X86 IO问题主要是指: 说实在的,个人感觉panabit兄对cavium/rmi/freescale的芯片不是很了解,甚至对x86也不是很了解,所以才不能正确去比较它们的优势和劣势。感觉你是在安全行业,但是对安全产品的硬件方面,也不是太了解,所以,觉得很多看法感觉只是隔靴搔痒,说不到点子上。x86在安全产品有市场,完全是历史的原因,现在这个市场正在远离它。随着安全厂商的成熟,他们有能力去构建自己的软件平台的时候,基于非x86平台的解决方案会占越来越多的份额。就拿高端来说,用 risc加内容过滤芯片的组合,性能上会比x86 纯软件的方案会强很多。 拿 I/O 说,pcie总线由于协议复杂,有效数据的吞吐量只有理论值50%左右。这个对于高端系统会成为吞吐的瓶颈。 当然,最终的胜者还是要靠市场来决定,就像当年HT/PCIE之争,rambus/ddr之争,最终胜出的不是性能最好的,而是市场能接受最快的。 panabit兄,供应商的稳定性问题,肯定是设备商最关心的问题。当年H3C在greenfield上栽了大跟斗,所以HW,ZTE等大客户在风险控制方面的经验肯定多多。 btw,我们也要破除供应商就一定是大厂商的迷思。Intel不是也把IXP系列给倒手了吗?对于像Intel这样大恐龙,瞧得上通信处理器(甚至是通信多核处理器)这个细分市场吗? startup在创新肯定有可取之处,否则在美国这个充分竞争市场,根本就没有存在的必要。 其实这方面可以学习cisco,对于有价值的startup加以收购(当然,这个又要考虑米国政府同意与否了)。 panabit 兄,我觉得你需要认真研究一下cavium/rmi的芯片再来讨论会更有意义些,因为我感觉你似乎完全不了解他们。如果我说错了,请见谅 “拿 I/O 说,pcie总线由于协议复杂,有效数据的吞吐量只有理论值50%左右。这个对于高端系统会成为吞吐的瓶颈” pcie的问题还是Qos,通道化支持channelization suppport),flow control弱。作为packet interface,先天不足,不能和SPI4 Interlaken接口pk。 行,文人相轻的老毛病快要出来了。其实,技术观点通常都是各有道理。这与个人的经历有关。所以不要勉强。互相学习才是王道:-)。 关于Matrix的“其实这方面可以学习cisco,对于有价值的startup加以收购(当然,这个又要考虑米国政府同意与否了)。”。如果您阅读我这些年关于华为的文章,其实是在劝他们在技术上做好准备,购买公司,扩展起来。 华为目前山头林立。藩王遍地。而且许多人极端自信。认为什么都可以和应该自己做。 我拭目以待。 会58楼: 这篇文章本身一般,就是报道一个业界收购。但引发的讨论相当优秀。基本上涉及到了目前通信业界的精华。而且人员参与感觉来自各大通信公司的骨干人员。我自己也学习到了许多东西。我会把这篇文章标注为“弯曲推荐”。 Panabit 兄,”我觉得IOAT中最值得欣赏的特性是DCA(Direct Cache Access),这个特性用的得好” === 注意这玩意XLR一直都有,XLR是多少年前的产品了? Matrix 兄,你说得很对,的确是这样的。正是由于这些,所以我说X86正在发生积极的变化。IOAT的推出我想有3年左右吧(所以应该比XLR晚一些,至于 DCA,应该是07年出来的,是IOAT2中的内容,所以就更晚了)。另外,据我所知,XLR刚开始推出的时候,是将小于112 Bytes的包放在内存中,所以当时Cavium在这方面的测试结果要差于RMI。后来Cavium也做了这一点(但是好像是98 Bytes以下的报文,这两个数字我需要再考证一下)。Intel的这个DCA特性强在什么地方,就是它拥有相比CAVIUM或者RMI大得多的L2和 L3 CACHE,所以能够同步更多的报文。 Panabit兄,你对RMI packet L2 cache allocate功能理解有误。 它有一个寄存器,可以控制报文头部多少字节同步搬运到L2 cache。比如说,设置寄存器为0xf,则搬运packet header 15个cacheline(32 byte)= 480字节进入L2 cache。 报文整体都在内存中,但是报文头在cache,而一般报文处理显然处理报文头的几率大得多! DCA? 还是matrix是行家里手 Matrix 兄,“报文整体都在内存中,但是报文头在cache,而一般报文处理显然处理报文头的几率大得多”,我赞成你的观点。可以控制SIZE的特性是刚开始就有的吗?这是一个非常好的特性,Intel的DCA目前还缺乏这方面的东西,或者说目前支持IOAT的网卡或其它外围设备还不支持这个可控SIZE的特性。另外我想再阐述的是,我的观点并不是否定或完全肯定任何一种架构,我的核心观点是,当我们一直对某个东西熟悉,并心里否定另外一个东西的同时,不妨想一想,“我这样对不对?”。另外,架构的选择也同自己面向的领域和产品形态息息相关(当然这都是废话了,呵呵)。通过X86这个“炸弹”,我学到了很多东西,也希望弯曲评论越办越好!:) aaa兄,P4080 宣传今年Q2样片。现在能够sample了吗? FSL通信处理器老大哥做惯了,市场需求反应有些迟钝呀。 Matrix 兄,“报文整体都在内存中,但是报文头在cache,而一般报文处理显然处理报文头的几率大得多!”,我非常赞同你的这个观点。另外,XLR的这个控制 SIZE的寄存器是一直就有的吗?这个特性是非常有用的,它可以让你在CACHE POLUTION和性能之间自己来做平衡。Intel的DCA,或者支持DCA的网卡或其它设备缺乏这种特性。 Matrix兄,有兴趣的话,私聊一下,我的MSN: softmic_msn@hotmail.com。 感谢弯曲评论这个平台,让我认识到这么多高手,衷心祝愿弯曲评论越办越好!!! matrix兄,有同感。 问陈首席的问题,貌似netlogic买断rim是为了增强其 multicore processor+tcam业务,这个业务与np+tcam在交换路由或者其它领域会有冲突吗,国内的厂家像HW,ZTE,DATANG,H3C现在用的主要是cavium还是rim为主(与tcam结合的部分)? 前面Matrix兄和Panabit兄提到RMI packet L2 cache allocate功能,确实可以通过配置将部分报文直接放到L2 cache里,但问题是此时报文还没进入CPU内部进行处理,仍然积压在其硬件加速单元里。大量尚未开始处理的报文占用L2 cache,必然会导致正在处理的报文出现cache miss的可能性增大,对性能也没有好处。 @老韩: EP80579确实算是比较初级的SoC产品-只是把传统的Core+北桥+南桥+加速器做到一个die上,感觉并没太多系统级优化,例如互联设计等。 你说的失败的地方主要是哪里?芯片指标不过关,还是软件栈支持不好,或是系统开发方面? Racoon兄,你说得对,会有这样的问题的,所以那个可配置的SIZE寄存器是一个很好的特性。这个对小包的贡献还是挺大的,X86的CACHE比较大,也会好一些。 Racoon兄,你说得很对,的确有这样的问题,这实际上是对CACHE产生的POLLUTION了。所以那个可配置SIZE的寄存器就很重要。这个特性对小包的贡献是蛮大的。特别是在做性能测试的时候,呵呵。 @matrix大大 顺便搭车问各位大大几个问题: EP80579,简而言之就是性价比不高。我一开始觉得最有可能的应用是SMB级的存储,Netgear,Linksys之流可能感兴趣,可一直没有看到。 Intel现在已经把80579边缘化了,后期传说中加入IXP RISC核的计划也停了,现在推的是Atom和ce600/1G。 得,Intel买断Windriver。x86进入什么市场?嵌入式:-) 今天简直太匪夷所思—Intel 收购windriver 难道intel要大举进入嵌入处理器市场(通信处理器算是其中的细分市场)? 难道要首先收购windriver,给powerpc和mips一个下马威? 服了,真是混乱年代,必须神经彪悍! 我期待大家的讨论。我看一下大家的讨论。对Panabit对系统的理解比较欣赏。能说出x86解决了I/O问题这句话,说明确实有点功力:–)。是个搞技术的好苗子。也希望其他华为的同学们看看Nehalem的介绍。 当然,并不是说Nehalem微结构可以做NS5000E的Forwarding了。只是说,事情都在悄悄地演变着。。。。。。 1,字节序 这两天还在与windriver的人交流Wind River Test Management。我还说难道Wind River也要学Thoughtworks做咨询公司了。不想晚上就看到被Intel收购的消息。 Intel想干嘛? 不知与ATOM芯片的长期发展是否有关系。反正,加强软件力量,获得一大批已经存在的客户account意思是事实了。换言之,华为的VRP vxworks是捏在Intel的手上了。咔咔:-) 这桩收购,带来很多变数. Freescale这下该找谁(montavisa, Green Hills, QNX???)来支持它的芯片? Cavium还有Netlogic(RMI)它们该如何面对呢? montavisa我记得好像是Intel是背后最大支持者,powerpc这几年确实有些没落了。。。 华为对intel的芯片很清楚的,有专门的团队在研究,intel也有一个专门团队跟华为负责接口。而且,华为内部也作了intel的刀片,跑suse linux, 供内部使用,以及搭售服务器的时候顺带卖卖。 做设备厂商,性能不是最重要(能满足市场规格就可以),整板,整框设备成本能降下来才最重要。买一个设备挣一笔钱,在选型的时候,某个方案可能因为多一个FPGA片子都可能会导致出局。所以,intel不做soc,基本上没有可能能赢通信市场。 VRP 只是数通的软件平台。其他产品线不是基于这个。更底层的是Dopra。不过,hw所有的东西都是工程化很好: 模型简单,上手快(新员工能很快干活),调式手段丰富(出了问题可以有很多追踪/排查手段,这个很对工程化及其重要)。但是,从纯软件设计角度看,结构很差,很混乱,效率/性能也是非常低。 1. X86的对于嵌入式系统来讲,是综合性的欠佳,不是单一的某个方面.比如讲功耗,有人说ATOM的功耗很低,可是你仔细看下ATOM的功耗低是只它这颗芯片的功耗,没有包涵外部的桥芯片等等.而现在的嵌入式系统都是SOC,我们讲RMI还是OCTEON,这些芯片是都是直接出几十G的外围接口,在看看通信设备的需求,有XAUI/PCIE/SERDES等等不同的接口,但是X86就需要挂桥,还是桥,这个整板的功耗是多少?这个成本又变成多少.所以大家看问题要站在系统设计的角度去看,而不是只是单纯的从一颗CPU,单纯的看它的CACHE有多大,主频有多高.真正有系统设计经验,熟悉多核的架构师,应该会明白我的意思.而不是只是简单的测试一下. @hope: @kiss 和你的观点恰恰相反,如果x86是software stack的问题,intel很容易去解决。想当年IXP多么庞大的软件库,intel都做得非常好,所有通信厂商都对此赞不绝口。我以为还是和硬件/系统设计相关部分的才是目前x86的弱点。 Xscale/IXP出售不是对x86的信心,而是迫于无奈:看不到获胜的前景。在出售他们之后很长一段时间内,直到现在,intel对于如何重新进入这一市场没有明确路线图。 而当初intel进入NP市场,软件/硬件/文档/客户培训都是做的非常到位,所以很快能把其他家NP拉在身后。 很热闹,在下也来班门弄斧一把。 X86当前来看在通信领域的应用作为控制面比较合适,而且是在对CPU性能要求比较高的控制面应用,以及对高层业务处理比较多的特定领域,例如DPI。 Intel在Embedded领域是有大的动作,X86也在向SOC方向发展,但其主要基于PC应用的视角设计的处理器确实不适合作为数据转发应用,个人判断未来几年内Intel的X86处理器在转发领域难有所作为。如果Intel确实想进入这一块市场,只能通过收购一家合适的公司,靠自己的得看 3-5后的X86新架构如何做了 Intel 收购WindRiver的影响估计通信业界都会在看,看Intel的后续策略,如果其能保持原有的第三方态度,能够很好的支持PPC/MIPS的后续发展的话,Vxworks在通信领域会得到继续的发展。但这点很难,这和intel想在Embedded领域大展拳脚是冲突的。 linux和FreeBSD之类的软件可能会对此次并购持欢迎态度。相信有长远目标的公司对是否继续使用vxworks会进行深入的评估,很可能会转型,因为PPC/MIPS的新一代处理器如果Intel不支持,其后续的产品是没有发展的。 X86在数据面的应用,先不考虑其性能如何,首先产品的系统方案就会很复杂,需要配合大量的外围芯片,硬件综合成本非常高,工程实现也是一个很大的挑战。 @随便扯两句: 顺便请教一下各位大大:一般来说本土厂商系统工程师选择芯片大概是个什么样的优先级? RMI要被卖掉在圈子里面已经流传了很久,应该是一个半公开的秘密,可能最大的秘密就是谁来接盘了,没想到突然爆出Netlogic来。 TCAM由于其优异的查找性能在转发领域的贡献是有目共睹的。由于TCAM的功耗与其容量基本是线性增加,随着路由表和转发表越来越大,在核心路由器领域,TCAM的容量问题已经成为转发表的一个瓶颈。 在中低端领域,10G以下处理能力的设备,低成本的解决方案还是比较多的,RMI的竞争力并不是很明显。 如果如前面的大侠所评论的那样,Netlogic希望通过收购RMI来增强其TCAM的竞争力,用处多大实在难说。一句话,Netlogic收购RMI的效果有待继续观察。 根据个人的经验,大厂是不能迷信的,这年头,挂羊头卖狗肉的多去了。观察某个产品的长远发展要看这个产品在其公司的地位,只有其核心产品的保障性才强一些,外围产品特别是跟风想赚一把的,前景都不太美妙。 IBM实力强吧,但因为NP得市场对于IBM来说实在太小了,发展又要投入很强大的力量,最终还是放弃了。 Intel更是前科不少,在光通信一片火热的岁月,Intel也毫不犹豫的进入,收购一些公司,不知道有没有听说过Intel的10G光收发模块,但现在早就解散了,其相关的IC业务也卖完了。还有IXP的例子,前面的大大已经说了不少。 Cavium在下一代多核的进展上好像碰到困难,其路标已经再三推迟。。。Cavium在这个领域能走多远,也许很大程度上就决定于其下一代多核的成败上面。 Freescal在多核上反应比较慢,不过终于还是反应过来了,不管是CORE还是芯片规划,在后续的发展上有着相对清晰的路标。在下一代多核上,FSL除了延续在控制面的竞争力之外,在IO处理上也在大幅跟上,同时其节能和安全加速引擎看起来也还可以。 也许在1年前Cavium/RMI还能够比较轻松,但相信09年10年后,FSL的压力应该是很明显的。注意啊,是FSL侵入Cavium/RMI领先的领域,而不是全面的竞争。 只要FSL的内部不发生问题,从长远看,能够和Intel抗衡的还是FSL。 还有一个ARM,现在发展势头还是比较猛的。ARM携其在消费领域的霸主地位,正在向更高端的领域发起冲击,这是其发展的必然,也是终端消费领域发展的需要(各种智能终端产品的功能越来越强大,对CPU的处理能力必然要求更高)。 因此,在低端市场,PPC必将面对ARM的竞争。 这样看来,PPC以后的日好像不会太好过啊,前有狼后有虎,高端有Intel虎视眈眈,低端ARM在发起冲击,中间还要和MIPS周旋,苦啊。。。。。。。 观察处理器的时间不长,上面乱七八糟写了一些,有不对的地方欢迎各位大大指正。 此外,建议弯曲开辟一个处理器专栏,以便朋友们交流各种信息和讨论 ALL IP分析的很有道理,建议也很有价值。支持。 谢谢建议。会讨论。Stay Tuned。 赞同ALL IP的观点,未来处理器的一定是X86和ARM的天下。 楼上的口气很大,感觉你对网络处理器比较熟,且对其有某种偏见。 笔者认为, 2.PPC/MIPS不可能消亡。embedded是个细分的市场, x86, arm不可能通吃.但ppc/mips来自x86,arm的威胁会越来越大.将来的日子肯定不会太好过. PPC,现在该叫Power了. 目前主要有IBM, Freescale, AMCC支持.曾经有个PA semi,最后Apple买断了. 还有xilinx FPGA也集成了IBM的4xx core,但貌似xilinx准备抛弃它了. Freescale应当是Power的主力军,如果它哪天倒了,那莫Power(ppc) 阵营也即将瓦解. Power在IBM也就是它的server/supercomupter在用,其出货量很有限.再说,IBM现在大量采用x86作为它的处理器. AMCC就不用说了,它的主力都来自IBM.没有完整的产品线,市场份额也不大.一句话,PPC的未来就靠Freescale了. PPC太自大,不open.相反MIPS跟PPC不一样, 它的license模式比Power要强一百倍.不少公司license了,在STB, HDTV, networking还是有不小的份额.在相当长的时间了,MIPS ISA不应该会倒.(对了不是还有个ICT的Godson??? ), ARM是其最大的对手了. 3.个人很看好ARM的前景, 其商业模式和产品技术上都值得称赞. 它的ecosystem很庞大很完善.其规模不亚于x86在PC市场. 4.NP专著与data plan, 目前高端市场固然有一定市场. 但随作 mulit-core GPU with network acceleration地加入, 和设备商的ASIC/FPGA for dataplan. 未来的处理器一定是谁的天下估计还是很难说的吧,从目前来看,Embedded处理器市场3-5年内应该是群雄争霸的时代,X86、MIPS、ARM、PPC都有一定的机会更进一步。 如果Intel真正打算向做PC一样来做Embedded的话,几年以后倒是很可能成为一支强大的力量,前提是Intel的处理器架构会为Embedded而改变吗 ARM在低端消费领域是无敌的,但要向上走,其成本功耗的优势还能有多少,还需要观察,性能要求越高,相对的对成本的敏感就相对低一些。特别是进入通信领域,可靠性要求越高。。。ARM任重而道远矣 NP最大的优势是灵活性,但灵活性也就决定了其技术的复杂性和可实现性,到目前10G/20G NP才比较成熟,而40G NP等了n年了都没有出来,100G就更不知道在哪儿了。。。在IP领域顶峰还是得靠ASIC+FPGA来搞定。NP在中低端市场还比较现实。但随着多核 CPU时代的到来,在这个领域NP和多核CPU(MIPS/PPC)有得争。。。 不少大侠对Intel的IPX好像很推崇。据本人的了解,IXP12xx、24xx的市场表现还可以,可能很多安全领域的在应用。 而ixp28xx,则是一种无奈的选择,当时在10G NP市场也很是热闹,可惜AMCC半途而废、IBM不干了、好像还有一个Agere,但28xx好不好可能只有用它的人才有发言权。28xx其实本质还是一个5G的NP,10G还真是难为它了,cisco后来用它做了一个5G的处理平台 同意楼上的。。。 得。这几天x86派的得势,MIPS选手不吭声了:-)。PowerPC的人马就没有出现:–(。 怎么这么快就划分势力范围了,陈首席觉得在下应该是哪一派呢,呵呵 吐血敲了这么多键盘,没有入得高人法眼,几无响应,积极性都有点受挫的感觉了。。。。。 在通信和网络市场,我个人觉得可以从设备商的decision maker的角度看这个问题, 他们不会太关注powerpc Core还是MIPS Core, 重要的是SOC, 是接口, 是feather, 是功耗, 是die size, 是内部加速器; 如在存储市场,额外卖点在RAID接口, TOE功能等; 在无线市场, 额外卖点在SRIO, SNOW3G等; 在网络interface Card,卖点在于接口(如XAUI, SPI4), 保序,流原子, QOS等等; 从这个市场看, 并不是power跟mips的PK,而是cavium, rmi, freescale公司之间的PK. 所以X86,ARM怎能一统天下呢??? die size设备商还关心?他们更关心money, price. 还有 ALL IP,我一回到家就是看是否有讨论。你们的每个发言我都是反复看和想。自己也学习了许多。 在最近的评论中,关于ARM要朝通信和高端设备上抢饭吃,是非常重要的,而且是在发生的。。。 die size设备商当然关心啊; 比如无线市场, 很小一块板需要放入一个多核cpu, 多块dsp和fpga, die size也是很重要的; money, price, roadmap, 支持当然都是非常非常重要的, 我前面的意思是一个当前产品的卖点, 不是说公司的卖点;设备商选型当然是全方位的, 我前面更多的是指产品这一块; 那是package和pin的规模.不是die size. 40G NP已经商用。 @陈怀临: 我挺ppc的-曾经吃饭的玩意 :_ ) @螺丝钉: 多谢解答。继续请教一下,如果core不是differentiator的话,从应用角度来说,目前要使设备商迁移到另一种处理器/SoC是不是不存在太大困难?另外,对于芯片供应商来说,那些接口,feature,功耗,加速器也不容易差异化吧? 看了各位大大的帖子,也凑个数,纯属抛砖引玉 从通用core/processor的角度来说,接下来五年内的竞争非常有意思,太长远的就算了-”The long run is a misleading guide to current affairs. In long run we are all dead”。个人觉得,x86和arm现在的位置都处于上升势头。因为都有killer customer,有volume可以支撑继续投入: arm统治mobile handset,x86是pc/server。而ppc/power的位置有待持续观察,mips的形势就不太妙了。 MIPS:商业模式跟ARM雷同,缺乏占垄断性地位的市场,消费类市场高端部分肯定受arm的侵蚀,通信市场受ppc压迫,还有新进入者x86。目前来看处理器方面有完备的产品组合(低中高端),但一些MIPS vendor,如Broadcom/PMC等都不在core上继续投入了,而反观ARM,除了ARM本身,Qualcomm/Marvel等作为ARM的架构受权者都在积极推动处理器内核的研发。MIPS Technologies作为公司能不能生存下去我都觉得是个问题-最近买了chipidea又卖了就是个证据,他自己都还在寻找战略。实话实说的说,MIPS卖给ICT/Godson倒是个非常好的归宿-跟党走,大富大贵不一定,衣食无忧是肯定的,这样才可以保留一个“通用”处理器的名分。 ppc/power: 在部分市场(通信,Game Console,HPC)占一定统治地位,还有个强大的爹娘-但都三心二意。但各厂商之间研发重合,同样存在互相竞争。 x86: AMD几乎给不了Intel任何压力,本身已经自宫-”only real men have fabs”,如果本身的设计再出麻烦,生存都是个问题。所以Intel现在可以聚焦于“x86 anywhere”了,Intel在芯片设计和制造上的优势明显-领先6-12个月(?),技术上的两个短板low power x86 and SoC-目前有14款32nm工艺的atom-based soc正处于开发中(source: EETimes),针对嵌入式市场的software stack的软件链都正在解决中。接下来主要的PK,一是在mobile internet device上跟arm,虽说击败arm不可能,但占据部分市场份额是一定的。而且这一次必须要狠狠地打,应该是首要目标,也是接下来最大的看点。二是 GPU,x86-based Larrabee Vs NVidia。三是非MID的消费类电子,其中包括game console(这是个量很大的市场,如果赢了,可以烧掉ibm微电子的一个大粮仓了)。与上面一位大大提到的相反,在Atom上和TSMC的合作,并非不重视,而是一个战略性的举动,适当的时候可以将Atom直接授权给系统厂商(Atom的IP不对半导体公司开放的),抢占市场。另外,Intel的力量还不仅仅在技术方面,市场力量同样强大,Pentium 4可以说是一个比较失败的产品,但却依然是市场上一个成功的产品。但x86是否将通信市场视作tier-one目标就是一个问题了。 结论:long x86 and ARM, no idea on ppc, short MIPS, as general-purpose processor @KISS, ,个人觉得core不是differentiator,从应用角度来说,目前要使设备商迁移到另一种处理器/SoC应该难度不大,大公司一般会做一些多核支撑平台,减少各种产品差异性; 而且迁移更多是工作量问题; 当然如果厂商特有的feather, 移植需要费点劲,如用到octeon的定时器功能,flow atomic功能的话, 迁移到rmi上就需要使用软件或者换实现方法; 同意24层whoknows. 不能用PC的视角来看通信设备。 25层“NETLOGIC在国内的业务最主要就是hw/zte,他们需要大量使用tcam+多核处理器的方案,两个公司合并以后,可以给他们提供更好的解决方案和参考设计。” 1。问题是有多少RMI的核心成员能留下? 29层陈怀临 个人认为, 46层KISS 我们不得不承认Intel有强大研发制造实力.但用一个in-order, single issue的atom集成tolapai的外设,很难想象它在网络通信市场能有多大作为. @ JackBauer: 40G NP已经商用?方便透露一下吗。。。。 @ KISS:据了解FSL可能专注于e500mc了 补充一个有意思的说法:在80s-90s初RISC热潮兴起的时候,一度占据了server市场的很大份额,但pc上失败了,原因是:MS的OS代码较烂,而且使用了大量汇编,x86也较复杂很难移植到新平台,而服务器系统一般采用unix,代码很容易进行移植,RISC也很简单,所以小型机就挂了。 ps: IBM去年有一个防御性收购-Transitive,最著名的就是支持了Apple Rosetta系统背后的公司,专门用软件干这种事。 40G NP: Bay Chesapeake和Broadcom BCM88025/QE-2000都量产了. Xelerated的HX330有望成为第一颗100G NP, @aaa: 这里确实值得商量-free post,价值是free :_ ) @ALL IP?:thanks。这么说来freescale短期内是不会有64bit的ppc了 大地址空间,大内存的需要越来越迫切,尤其在高端的系统.64bit core 是一种发展趋势. 谢谢aaa! HX330也是如此吧 ————————————— Xelerated的HX330有望成为第一颗100G NP, 确实如此! —————– Xelerated的HX330,2009 Q2 sample,确实现在没有update了。100G的目标,基本上是cut-through,因为HX330内部TM只有50G能力的限制。 @aaa: @螺丝钉: thanks and… * 128KB backside L2 cache per core虽然个人认为少了点。 * CoreNet接口,这个很重要。 * new core to core signaling (msgsend/msgclr). * 中断优化, interrupt proxy. “e700是一个64bit,4-issue(?)设计,流水也比e600长” pipeline长不是件好事.如何能达到主频要求.个人希望Freescale还能保持它的7段流水. 我会在美西时间星期天的晚上8点,将这次大家对多核系统,处理器方面的讨论整理出来,并且发文。 我觉得是非常好的一次讨论。 我个人对处理器接触比较多,也参与设计芯片。但感觉真是天外有天。你们说的许多我都不懂。 这就是集体的力量。 期待陈先生的整理结果,从前面各位大侠的发言中可以看出,很多人都是行内的资深人士,可能受限于职业操守和NDA的限制,在很多话题上不能深入透彻,但也可以看出不少有用的信息。 希望关于处理器的讨论能够继续下去,更希望早日能够用到我中华自主之处理器芯片!! 螺丝钉: === 1,大家对ISA讨论得很带劲。其实说白了,ISA之间的PK就一口水坑。同意KISS大大的引用—“从长远看,人都是要死的”,所以不太关心ISA之间的pk 2,我认为讨论一些更实际的东东则更有意义。上面的螺丝钉大大已经开了一个好头。各位大侠继续…… 112楼 陈怀临 ” mips吧,就看rmi和cavium撑撑门面,自然势单力薄。 至于powerpc吧,fsl的兄弟老大哥做惯了,不屑讨论此类问题了。 | |
雁过留声
“多核系统与网络设备的大讨论”有62个回复
各位前辈,大家为什么只讨论硬件构架呢,要实现一个产品系统软件构架也同样重要,在下有一个问题,在很多多核网络安全产品中都提到control plane and data plane,比如linux OS 只运行在某个核上作control plane,其他核上用作data plane , 我的问题是:如何控制os只运行在某个核上(就是将所有的内核线程邦定到某个核上?),或者这些只是厂家的说法而已,谢谢!
在操作系统方面,如Linux,CPU Affinity是一个已经很成熟的机制,请阅读一下这方面的资料。
从最近qualcomm和TI推出的SOC可以看出,ARM已经吹响了进攻高端市场的号角。
应用和需求为王,客户才不在乎你用什么架构。
不是做研发的,对CPU之间的优劣没法说清楚。但是我很清楚一个数据,我们用X86的CPU做一个200M性能的安全设备,其成本,比用RMI的8核作出的1.5G性能的同类安全设备,要高很多。功耗也要高出很多。而这两款产品的售价显然是后者要高出前者很多。
我想就这一点的区别,已经足够我们公司选择RMI而放弃X86了。事实上当初选择X86,也只是因为X86的硬件平台是现成的,可以快速出产品,而用RMI则要多一段时间才能推向市场。
不认同4楼的意见,方便的话请举例说明,谢谢。
陈首席,我这方面的资料都看来并且做了试验,Linux CPU Affinity 是应用程序用的,应用程序通过这个可以指定自己在那个核上运行,我说的是OS,即所有的内核线程都RUN在某个核上,希望知道的前辈能指点一下,特别是做过基于多核的firewall的前辈。
回“老韩”:
具体的产品就不方便说了,我只能说这是一个真实的数据。
我不知道为什么很多人认为X86的CPU性能要好于MIPS的东西,我也确实不知道两种CPU究竟哪种更好。但是从我了解的一些皮毛来看,通信设备的典型运算都是大并发的。比如多线程的快速转发,使用RMI的8核CPU,可以并发32个硬件线程,我看到的实现是从5~32线程都是用于快速转发,也就是说27个并发的转发线程,X86的CPU性能再优秀,单核的运算能力能是RMI一个硬件线程的10倍以上吗?
我提到的那个200M的设备,采用的是双核的至强,成本本来就高,但是性能确实不怎么样。想想双核是8核32硬件线程的五分之一的性能,基本上就意味着,一个核的性能是对方一个硬件线程的3.2倍左右的性能,也不错了。
X86所谓的性能的优势恐怕是在浮点运算方面,而网络设备基本用不上浮点运算,那么这个所谓的优势又有什么用呢?
再从安全产品来看,国内大多数的安全产品都是X86架构的,从来没有出过真正意义上一对端口的小包千兆线速的产品。
所以,在我的印象中,X86做的通信产品都是低端产品。
7楼:拿X86做转发,真是难为它了,它根本就不适合干这活啊
这个讨论越来越远了,建议评论之前将那篇有170+评论的文章的评论仔细看看。现在越看越好像在做X86和RMI或者CAVIUM PK了。BTW, zeroflag,你那个双核XEON只能做到200M小包的设备是一个什么类型的设备,是防火墙之类的吗?如果真是这样,从技术角度看,那个厂家估计该关门了,呵呵。另外,多核的转发,也并不是就可以做到完全并行的,你用RMI的话,在没有POE之前,你怎么着也得找几个线程做保序用,而这些保序的线程就会是瓶颈。这方面不能用厂家提供的那些passthrough例子来说明性能,因为这个在实际中就不存在,也没有什么意义。超过内存所能承载的核是没有多大意义的。
Panabit:
不是防火墙,是一个L4~7深度解包、还原、分析的东西。如果是防火墙,那也确实该关门了。
我不是研发,不了解保序线程的性能要求,不过从现有的处理来看,也确实只用了27个线程做转发。还有5个线程用于处理别的东西,具体是什么我没问过,里面应该就有您说的这个保序线程。
小小的debug一下,不是5~32线程,而是5~31线程。这里没有编辑功能,还真是麻烦呀!
To zeroflag:我觉得您说的设备肯定有问题,应该越是4-7的东西,x86处理的优势越明显。最好能做个实际对比,我见过单路4核x86平台做应用层流量审计性能不到100MBbs,大量资源其实都用在数据实时编目索引和等待i/o响应上了。对您说的产品非常感兴趣
FreeScale确实做多核方面动作缓慢,令人失望。但PPC的社区势力强大,而且随着IBM要开始与思科一绝高低,IBM必将发力在通信,存储,数据中心等等领域,从而与思科决战。因此,IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。
—————–
这一段有点问题哈,貌似Power体系的网络处理芯片现在都是Freescale在做,什么时候IBM来做了?IBM做得都是Power体系的服务器芯片,网络存储芯片吧。
FreeScale确实做多核方面动作缓慢,令人失望。但PPC的社区势力强大,而且随着IBM要开始与思科一绝高低,IBM必将发力在通信,存储,数据中心等等领域,从而与思科决战。因此,IBM必将通过各种合纵连横的方式大力发展PowerPC的网络处理器芯片。
—————–
这一段有点问题哈,貌似Power体系的网络通信处理芯片现在都是Freescale在做,什么时候IBM来做了?IBM做得都是Power体系的服务器芯片,网络存储芯片吧。
IBM做过,但是更让人失望,PPC已经开始淡出市场了,最终都会是开放架构的天下(ARM, MIPS),除了x86
matrix 于 2009-06-03 6:41 pm
这里讨论的是具体的产品—采用x86架构的Intel的片子和采用mips架构的RMI CAVM的片子,FSL ppc产品线.
KISS大大,对于以高集成度为卖点的SoC来说,难道我们只会关注它说采用的ISA?
# KISS.曹操 于 2009-06-04 6:11 am edit
顺便搭车问各位大大几个问题:
1,从OEM系统用户角度看,FSL的e500比e600的优势有哪些,对于通信应用来说?
2,FSL的e700是不是取消开发了?QorIQ的roadmap里有没非e500的产品?
# 老韩 于 2009-06-04 7:03 am edit
EP80579,简而言之就是性价比不高。我一开始觉得最有可能的应用是SMB级的存储,Netgear,Linksys之流可能感兴趣,可一直没有看到。
netgear是有在做这个产品,不过好象还没有完成设计
IBM做过,但是更让人失望,PPC已经开始淡出市场了,最终都会是开放架构的天下(ARM, MIPS),除了x86
——————————————
powernp在同时代的产品中还行,原来有下一步的计划,退出是因为np的市场远没有达到它的预期,ibm的策略是一旦某些市场达不到她的预期,该产品线一般就会扔掉,所以用ibm的东西还是有些风险 :–),已经转到hifn了,动静不是很大了。
“PPC已经开始淡出市场了” 远远没有,fsl销售很大一块还是这个,在高端工控,车载,基站等有不少应用,也有lisense core了。ps:mips现在日子可不好过啊,呵呵
怎么我感觉mips越来越开始上台阶了呢?
难道站的角度不一样
其实Cavium/RMI如果真的成功、或曾经那么接近成功的主要原因,就是他们致力于这片细分市场。他们用了体系较为开放的mips,再在内部总线、网络包的预处理、核间通讯等方面做了一些很有创新意义的工作,Intel为什么不做?也许不是它不能做,而是它确实没有时间顾及这片市场。
可惜这个市场也不是那么容易做的,基于多核的产品开发,似乎都有点雷声大雨点小,似乎做安全的用Cavium比较多吧,国内用RMI也不少,RMI在北美的代表客户,Juniper,也一直没做的怎样,这些大客户们没给RMI肉吃,RMI没办法了,只好投身Netlogic,可惜了,但也许不是坏事,呵呵。
如果Intel真有一天醒来要做这个东西,,,,,,偶觉得这个假设就一边去好了,回忆一下Intel怎么斩去网络通讯部门的吧。倒是Freescale如果醒来的话是很恐怖的,不过,就F公司退出双核的速度来看,人家似乎对此不是很感冒。
所以,未来留给Cavium/Netlogic(RMI)的想象空间还是很大的。
偶看楼上好多人在讨论ARM、MIPS、x86的未来,呵呵,别讨论了,技术牛不一定是最后的胜者,要看市场。
写错啦,不是说freescale退出双核,是推出
应用决定系统,系统决定硬件,有些结论是比较基本的
ASIC:商用已经超过40G,最不灵活,性能最强,JUNIPER最狠,其可编程ASIC还是很牛的,但如来如何,其核心技术是高性能和在一定程度的可编程,请灵活性及其有限
NP:商用为20G,40G还在路标中,是微内核,性能被ASIC差,但灵活性类似CPU,但代码空间极小,代码都在内核中运行,难以处理复杂的L4-7层业务
多核CPU:商用10G,但10G时处理业务有限,所以需要同时叠加多片,此类CPU如果能做到代码很小,完全在CACHE中运行,那么其代码空间和NP类似,当然性能也类似,但多核CPU的定位不是NP,所以不会这样用,目前处理L4-7层业务,包括防火墙,DPI,视频等比较理想,目前因为核心路由器的控制层面负载越来越高,包括包处理,虚拟路由器,逻辑路由器,NSR等需要,采用多核CPU已经是基本趋势
通用CPU:各路大侠分析很深,不必多说,目前看不到适合做高性能处理,当然目前多核的通用CPU有上面MIPS多核有一定的相似性,目前有一些试点做路由器类设备的控制层面
至于ARM:大侠们也都分析得很清楚,适合小型的移动和多媒体设备等,目前还看不到在10G级高性能业务使用的规划和前景
上面的各类,基本定位明确,彼此间冲突较小,但在系统设计时,在兼顾行性能和灵活性的情况下,如果把主控板和各类接口卡也放在一起考虑,这样一个复杂的系统包括了:ASIC+NP+多核CPU+FPGA+单核小型PPC/MIPS CPU.可以想象,这样的一个系统设备,有多复杂,代码行数进千万,其压缩后的bin文件(image)超过100M,人力投入以千计,开发管理从IPD,CMM到敏捷开发,这个门槛相当的高,在国内H在第一档次,Z在第二档次,其他的各自在自己的专有领域里做问题不大,但进行这个级别的系统,不需要也不能.但是,要知道H的硬件的平台是通用的,这个平台出来后,被免费用在其他业务平台上,结果对其他业务领域造成很大的冲击,但是H对其他业务领域业务本身的理解有限,并不一定有这些业务领域的领先者高,所以H在进入这些领域好,还没能很快的爆发出力量,但是以后会怎么样,很难说,看吧
楼上谈论了很多CPU,但我认为一个很重要的东东大家都没有谈:就是DSP,DSP目前在通信/图像处理等系统中用的非常多。
有人说嵌入式系统复杂,掌握起来困难,我看DSP更复杂,上面没有操作系统,基本上就是自己做一个微内核来编写,调试也极其困难。
啥时候Linux能在DSP上跑呢?
另外多核CPU能否战胜DSP呢?
有意思的话题。我想想。。。。是的,其实多核首先是在DSP领域铺天盖地的。。。。。。。wxh,现在DSP上run什么rtos,或者大多数是自己inhouse写的?
DSP早时内置用小的RISC CPU,后来为提高性能有用小型NP和多核的。DSP以前用PSOS的有,不知道现在流行什么了。DSP的商业开发的调测,确实是不大好搞,导致复杂问题的定位很烦人,操作系统是一个问题,还比较麻烦的是它作为一个大系统的一部分,难比较独立的调测系统比较难。不大懂,随便诌几句
陈首席及诸位高人:
指令集的设计如何入门呢? (有了基本mips的基础了)
一般都是厂商的私有的RTOS,作为一个库提供,通用型的不多见,这玩意更注重高效的算法,一般都比较简单精炼。
设计指令集??想干嘛?!:-) 这东西我干过。不容易。。。
通常,你是这样的一个思维逻辑:RR模型。如果不知道什么意思。请不要继续往下读。
然后要知道一个ISA要有I-type, R-type,J-type等。这些都还比较容易设计。。。
比较复杂的事中断的处理。这方面是往往你们“具有基本MIPS基础”的大牛们没想到的。。。。。。
对一个中断指令的设计,这里面涉及的问题就很多了。。。。。。
总之,没事玩这个干嘛???现在流行的是写iphone app,android!
TI 的DSP是自己的一个微核BIOS,只有任务调度。不过用起来感觉很好用。
[对一个中断指令的设计,这里面涉及的问题就很多了]
是不是指的这么个问题:
在返回的时候要同时做两件事情,一是恢复原来中断的那条指令,二是同时把特权级从kernel切回到原来的状态。否则这里就是安全漏洞。
[对一个中断指令的设计,这里面涉及的问题就很多了]
是不是指的这么个问题:
在返回的时候要同时做两件事情,一是恢复原来中断的那条指令,二是同时把特权级从kernel切回到原来的状态。否则这里就是安全漏洞。
估计还有流水线相关的问题…
Forrest 说的对,基本上是DSP厂家提供了一个微内核,大概几百K.
我是1周前才找到tektalk这个好地方的,这几天看了这里的文章,发现对数据通信讨论的比较多,但对于语音通信谈的比较少,希望能补充一下探讨。
目前MGW的业务量还是很大的,但玩家很少,基本上是ERIC/NSN/ALU/H/Z这几家在玩。
MGW的设计要求也很高,目前大部分厂家是采用DSP来做媒体处理,基本有两种方式:
1. 拿芯片厂家的DSP,设备商自己做算法;
2. 芯片厂家提供DSP,并集成算法进去;设备商直接使用。
方式2的开发难度要小一些,但受制于芯片厂家更多一些。
目前各DSP芯片商的Roadmap也是采用Multi core的,例如TI的6486,是6个核;
同上面的各CPU相比,我认为DSP的开发调试难度最大,主要是DSP的开发受制于如下几个因素:
1. 内存,每DSP的L2 CACHE通常是几M,片外RAM几十M;
2. 调试,缺乏开发工具,调试极其困难,特别是内存越界问题,极其难查;
目前有个疑问:
1. 既然大家讨论的X86,ARM CPU未来发展迅速,能否替代DSP? 这样会大大加快开发速度。
2. DSP实现的事情,采用FPGA/ASIC是否也能做?有先例吗?(主要是目前采用DSP做的系统集成度低,想尽一步提升)
另外,上次和TI工程师交流,他们收购了一家小公司,准备在下一代DSP上跑LINUX;
不过,我认为DSP内存空间如此小,LINUX内核能放进去吗?
现在TI的Davinci系列(双核),ARM side一般就跑Linux,DSP side是BIOS。
29,你说的很对。在设计异常处理(Exception)指令时,事情就变得复杂。设计指令,其实就是在设计一个处理器的微结构。而不是一个处理器已经设计好了,再来设计指令集。
通常而言,通信公司的ASIC工程师没有能力做CPU。是不同的expertise。即使能做一个简单的NP。但一定是非常简单的。clcok很低。如果封pipeline,但其实复杂性估计不然Berkeley CS和EE的作业难。
你们别笑,80%的工程问题,从难度而言,其实没有美国top5学校的大作业难。
“我是1周前才找到tektalk这个好地方的”
很高兴您这样appreciate我们。这就像美丽善良的女子,往往不是在烟花酒巷出没。你我行走江湖,其实念着的还是那盏万家灯火之中的温馨。
你不是喜欢《弯曲评论》,你喜欢的是温馨:-)
你我行走江湖,其实念着的还是那盏万家灯火之中的温馨。
首席这句话说得太好了。
深林人不知,明月来相照。这句诗送给tektalk.
“你不是喜欢《弯曲评论》,你喜欢的是温馨:-)”
首席真是与时俱进啊,呵呵
“你们别笑,80%的工程问题,从难度而言,其实没有美国top5学校的大作业难。”
能否写篇文章单独介绍一下这些个大作业都是什么样的?
Heeee. 是,我这人其实挺八卦的。。。
VOIP网关很成熟了。
前些年倒是有自己写代码实现算法的,不过那也是为了向IC供应商压价。
固网产品里面,DSP工程师已经消失的差不多了。
其实国内TOP20的大学大作业难度上来说也不低,只是抄袭风气非常严重,我在大学时代亲眼目睹过这些事情,每个班的作业都只有一个版本。
据说在米国高校,这种事情的性质被认为很恶劣,甚至会导致被学校开除的后果?
我记得上学的时候,就听说高中同学形容说南开物理系专业学起来很累,能把人逼疯跳楼,精神失常,做习题一天解出半道题都很激动,不知道现在90后如何上大学
确实是这样, 记得当时我们班作业有两个版本,男生一个,女生一个。可以说制造作业范本的同学对其他同学顺利毕业做出了巨大的贡献。
To JackBauer:
目前Codec的IC供应商基本上是那些DSP厂商吧,实际上是DSP厂商扩大了产业链,代替设备商把算法做到DSP内部了。
我是想问,是否能采用ASIC/FPGA实现这些Codec算法呢?这样性能不是更高吗?
类似于IP域,
DSP类似于NP和多核,
但其性能还是无法和Cisco的SPP和QFP竞争的.
to wxh168 : 可以采用ASIC和FPGA来实现,但是采用DSP实现主要是为了设计的可重用性。一次流片可以保证数百个应用。其实DSP这玩艺,并不一定要它和处理器的融合和集成,更确切地说,DSP更多地是工作在数据平面:)。
呵呵,有些声码器的厂商,自己直接卖芯片,但是他卖的芯片,其实就是固化了自己算法代码的TI DSP,只不过芯片表面打上自己的logo和型号。
[不知道现在90后如何上大学]
有一次跟我大学时的辅导员,现在的学校学生处一领导聊了聊,他说,现在小孩没几个像我当年那样对科技社团的活动如此狂热(可以整夜整夜摆弄单片机),都热衷于志愿者、街舞大赛,歌唱选秀这些事情。对于实践性强的大作业,已经从每班一个版本退化到了每个系一个版本…
To 路人甲:你的理解正确,其实从ASIC -> FPGA -> DSP -> 多核 -> x86 CPU,
性能是逐渐下降,但灵活性/通用性逐渐提升的。
比如今天我收到Intel给我的评估报告,采用最新的CPU: 4个Nehalem内核,2.13G 60W, Suse Linux, 处理AMR codec只能达到2000路。
也就是4片6486的水平。
关键是专用系统中,对功耗约束很高,对性能也要求很高,DSP都搞不定,因此我想问问是否有人用ASIC实现Voice或Video算法的,性能如何?
ASIC实现voice transcoding… 真扯淡…
asic现在都流行集成dsp了
arm11 /mips 24ke已经有了部分dsp指令
最好的表现还是dsp
to wxh168 : 或许你可以评估下FSL MSC8156,45nm工艺的,虽然MSC8156是为无线宽带专门设计的,但是其运算密度基本上是6486的两倍。6486有些老了,还是90nm的工艺。为Core network Transcoding设计的DSP还有LSI/Agere 的SP2612。
to wxh168 : 2000路AMR貌似要8片6486吧?
看到各位高人在讨论多核DSP,想请教几个问题:
1. 现在DSP中的程序很多用汇编编写,那么多核DSP的程序的开发模型应该是什么样的?虽说这要根据应用来看,但多核DSP的编成模型从总体上应该有值得提炼的地方,即应该有别于多核CPU。
2. OpenMP是否适合多核DSP的程序开发。
3. 多核DSP是否一定要提供BIOS.
mark
mark
2. OpenMP是否适合多核DSP的程序开发。
Answer: NO. OpenMP is too heavy for DSP application
3. 多核DSP是否一定要提供BIOS.
Only X86 requires BIOS
如果有人在贵公司内部胶片提议玩OpenMP,你们应该当初fire 他。马谡误国。
啊。。不会吧。俺刚拿OpenMP的benchmark用来多核选型。。不要fire俺啊。。首席你太狠了。
选型做benchmark可以。但不要用之写release product。
认识这个地方真好,
过几年再看这个贴, 可以证明哪些观点是对的, 也可以看出谁在裸泳.
老土是第一次看这个几年前的讨论。没看完。很多内容多有娱乐。说明首席开的这个讨论好啊。这几年发展了,不太一样了。PC麻烦了。intel还没回过气。ARM更大了。大家都用ARM多核soc了,big-LITTLE了,ARM64roadmap了,双核,四核,八核多了去。MIPS哪去了。Tensilica找靠山了。Tilera还在,前途茫茫。Loongson还在玩吗?低端ARMSOC在天朝和天朝台湾(Andys)枪地盘,好像有点气势。处理器与tool chain绑得更紧了。编译器不好,处理器必完蛋。要玩多核,看看GCC或LLVM支持啥,你就用啥,错不了••••••
16 nm FinFET semiconductor 年底量产。10-7 nm 技术也快了。不过,天朝不用担心。超前技术多赔钱。别人出钱出力做好了,成熟了,风险小了,立马跟进,快速赶超,错不了••••••
这几年安全行业感觉发展的不是很好,玩得东西变来变去,但是市场不见大,挣钱途径很有限,竞争更多体现在销售互相欧打。追求产品更高更快更强的公司打不过靠关系拉单的公司,追求什么技术,做最好东西,恐怕很多公司都看透了,不再感冒这个了。专注技术的人,或者早早转行,才是明智之举。
而从国内大环境看,这个行业是越来越冷,暮气沉沉,合并多,新生少,投资这个行业的人,基本深度套牢。赚钱的日子是遥遥无期的。