浅谈ZTE中兴科技的路由器体系结构和相关产品

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




【编者注:这是一些写得比较专业YET比较通俗的评论。来自通信人家园。作者网名为冲动到底和唯有杜康。作者的技术功底和视野都非常不错。】 

【冲动到底】 

Z说用自研芯片打造了200T的路由器,我们可以分析一下:首先,说路由器的芯片最核心的无外乎是:包处理引擎(NP或者ASIC),TM芯片,Fabric套片,算法查找芯片。

包处理引擎,路由器的最核心,是路由器的灵魂之所在。大部分核心路由器都选用NP,或者NP + ASIC的架构,采用纯ASIC的路由器一般不会做SR用,多数是IP-Core。NP的好处是可编程,但其编程能力并不是可以无限扩展会受限于软硬件架构。功能复杂,叠加过多后会影响其包转发能力。ASIC,整个转发流程已经固化,无法再灵活定制但是其转发性能基本上能实现设计要求。

TM芯片,流量管理/调度芯片。主要完成QoS调度,当前运营商的差异化服务保证,Trip-Play业务的满足等等都离不开这个小芯片。队列数和调度层级是其重要指标。

Fabric套片,交换网套片,通常有两片一片在线路处理板上,一片在交换网板上,这一套芯片限制了整个路由器系统的硬件架构,可以说是核心路由器的基石,其作用不亚于NP。(200T能否实现,如何实现完全依赖于交换网的架构,多播复制全仰仗这块片子,IPTV就是多播的典型应用,设备商都盼着大家一起IPTV,好挣钱,哈哈!

现在很多厂商将TM芯片和Fabric套片集成为一组芯片。

算法查找芯片:为什么要提它可能有人觉得奇怪。现在核心路由器是整个网络最核心的承载设备,承载海量的应用,现在全网BGP路由已经超过30万,VPN业务又是运营商挣钱的大头,VPN路由量级会更大,因此核心路由器必然需要海量的路由表存储查找能力。作为SR,MAC表容量128K已经是无法接受。IPv6的应用等等导致单纯靠TCAM已经是不可能,而且TCAM芯片价格昂贵,因此只能使用算法查找。

注:没看懂这个算法查找芯片。。。,应该举个例子。

从中兴的资料看
“响应政府的科技创新的号召,中兴通讯自主研发了高端路由器的三大核心芯片,包括ZXRIC PFE40高性能的40G网络处理器芯片组,ZXRIC SF600、SA40大容量三级CLOS级联分组交换套片和ZXRIC TME20、TME40用户功能可定制升级流量管理”

从其公布的资料来分析,其ZXRIC SF600的技术指标和DUNE公司的FE600完全一致,基本上可以认定就是DUNE公司的产品。

从理论上来说Z的这个200T需要64框级联(偶没算错吧,算错了不要砸我头),当前业界发布了集群路由器的只有三家C,J,H(ALU绝对没有),C,J,H目前开的局大多是背靠背,1 + 2, 2 + 2不是太多。西安会用H开业界首个2 + 4(道听途说哈!),祝福H成功,为这个和洋鬼子差距最大的电信设备放个卫星看看!

64框级联最复杂的不是怎么联到一起,最难的是64框的管理,协同转发,这是一套及其庞大的分布式系统,软件处理的难度完全不亚于硬件,硬件咱可以买,软件代码只能靠自己垒啊!没有非凡的软件架构,优秀的路由操作系统这是一个无法完成的任务。

包处理引擎就不说了,应该不是自研吧?也应该无法出40G端口,当前商用40G芯片可选择性不大。EZChip的NP4要2010年才能商用(C也在盼着呢!)。X公司的40G芯片不知道要到何年。

我们可以分析一下NP芯片在几个厂商的情况:
C公司的ASR9000系列其实采用的仍然是EZChip的NP3C(该芯片不售于其他厂商),其自研的QFP其实还只是一个协处理器,负责DPI等业务处理。C的优势其实是IOS。

【注:ASR9000上没有QFP。QFP目前是在ASR1000上。当然,估计很快。。。】

ALU,IOM3号称100G线速能力。但是目前来看应该是两片级联完成双向40G,100G目前应该还是单工能力。ALU的优势所在啊!

J,硬件实力一流的公司,其主力仍然是ASIC。MX系列是NP+ASIC架构。

H,NE5000E系列 包处理引擎是自研ASIC,Fabric是DUNE的。
NE40E/80E,CX600系列当前采用的是商用NP + 自研ASIC,Fabric TM为自研。
H数通苦于追赶的是自研芯片落后。包处理引擎从2.5G,10G,20G一直受制。

Z专门负责IP芯片研究的部门人数应该不多吧,30 or 50???而且众所周知其数通起步不是太早,只是这几年投入逐年加大, 要完全吃透一款商用芯片,就够这些人喝几壶了。商用芯片都没有琢磨透谈什么自研?如何自研?
有点当年毛爷爷赶英超美的味道。

写了这么多,太乱了,自己都搞不懂要说什么了(俺不是老兵哈!只是真正的略懂)
总结一下,Z透露的自研芯片应该就是DUNE的东西,而且从其软件平台,商用积累来讲等其200T商用不好估计是哪年。
Z赶在北展前放一个大卫星,商业目的不加评论,感觉是故意树敌,让别人过早明白自己的路标,而且是生怕别人不明白。(其M6000放的卫星也不比200T小多少)从技术上来说,有点意思,哈哈!

不过佩服Z的勇气,持续投入才能有产出,也能从刺激一下H,加速自己的芯片研发,有朝一日也放个大卫星。

每个厂商都需要一些东西做做广告,C,J,H也不例外。H自己的10G出来之前不也OEM了吗?
但H毕竟还是做出了个有点模样的东西,不希望Z最后交出来只是一片“汉芯”

【唯有杜康】

作为数据通信的老兵,看了楼上这些回复,实在看不下去了,不得不说几句,有问题请大家指正。
1.什么是集群路由器
   目前高端路由器都是40G平台,单槽40G单工,双工80G,8槽640G单工,就单台设备来说,目前CRS-1、juniper的T640 、阿尔卡特的7750、华为的NE5000E都是这样。 集群的概念是这些路由器的原先的交换矩阵只局限于本机框内互联,现在可以将交换矩阵独立出来作为一个机框,提高容量,而另外配置一个线卡框作为业务处理,线卡框和交换框通过光纤互联。 集群和背靠背连接的区别在于,前者是交换网间的互联,而后者是业务板卡间的互联(比如40G/10G业务接口互联)。当然,juniper和Cisco的交换框和线卡框之间的设计思路和实现方式不同。
2.目前商用的集群系统
   商用的集群系统,真正意义上的是Juniper的TX matrix 和Cisco 的CRS-1,最主流的应用是2+2,也就是2个线卡框和2个交换框, 按照设计,TX matrix和Cisco CRS-1 虽然交换网部分架构有所不同,但都是2个交换框最大支持8个线卡框,即2+8, 2+8=8+64,这不是简单的小学数学题,硬件和操作系统的要求高了很多不说,还涉及实际应用需求和工程施工、运营效率等问题。 因为集群系统不单单是芯片研发难度大,硬件设计困难,多设备的操作系统难度也很大,因此很多先前的项目都是两个CRS-1和T640背靠背连接,华为的NE5000E目前真正商用的所说集群就是这种。 就应用范围来说,TX matrix 和CRS-1在美国和西欧应用较多,AT&T就有好几十套CRS-1 2+2集群。  国内现有的集群主要是联通和电信的骨干网7大核心节点和各省市出口, 主要是CRS-1和TX Matrix, 而NE5000E虽然宣称自己是集群,但在联通和电信的实际项目中都是背靠背, 不过为了压低CRS-1和TX Matrix的高昂价格,电信和联通愿意引入华为,虽然我们国家的高端路由器的确有差距,目前一套2+2的系统,CRS-1和TX Matrix要近3000万,华为的估计1000万不到,虽然人比人得死,货比货得扔,但没办法,谁让咱中国人便宜呢?
3.40G和100G线卡
现有高端路由器40G线卡只有40GPOS 卡和思科和juniper的波分卡【注:WDMPOS卡。有兴趣的可参阅:思科核心路由器CRS-1与SPP处理器的研究–端口配置】,100G还没出来,也没实际需求,100G同样也是个涉及标准、软件、硬件和应用场景的技术,没那么快。 集群路由器要是从40G平台升级到100G平台,需要更换交换板、引擎。 100G ready这种说法,各个设备商都在说,这个没什么神秘的,大家都支持。
4.关于中兴的T8000
  目前没看到实物也没见过具体资料,不过有勇气有能力搞这个东西,至少说明中兴这几年在数通上的确有了进步,是下了血本,费了力气,勇气可嘉,楼上一些兄弟看到这个不分青红皂白,好像要除之而后快,我觉得大可不必,毕竟这个市场还是实力的比拼,能活下来的都是强者。 其实集群路由器的最难的还不是高速ASIC芯片,最难的是操作系统,这个不论中兴还是华为,比思科的XR 和juniper的Junos都有较大差距,未来10年,互联网流量将几何级增长,集群路由器作为网络的核心和纽带,市场需求将进一步增加,希望在这舞台上的不再是cisco和juniper的二人转,希望中兴的T8000和华为NE5000E不再是伴舞,而是主角。

另外,

1.集群的交换能力计算
关于流量,我试着算算哈, 以思科的CRS-1为例, 一般是算线卡的交换能力, 单框16个线卡, 现有线卡是单向40G交换能力, 因此单框单工的交换能力为:16*40G=640G,双工是1.28T,思科的CRS-1集群最大支持8+72,因此以40G线卡来算, CRS-1集群的最大交换能力是72*1.28T=92.16T。   中兴的200T我估计是根据交换网的容量来计算的,也是就说按照单线卡100G的交换能力计算,虽然目前只有40G线卡, 如果按100G线卡计算,16槽的单框双工交换能力是:16*100G*2=3.2T,而中兴的T8000最大支持8+64集群,那最大交换能力是64*3.2T=204.8T, 因此从100G线卡来说,200T的交换能力,这么算是靠谱的。 至于说按照现有实际线卡还是按照100G来算,这个是宣传方式和口径的问题,见仁见智的问题,我就不瞎评论了。

2. 关于ASR9000
   首先想说说BRAS这个产品的场景和演进, 这个层面业界通常成为POP点,或者说是业务控制点,是整个城域网的业务实现和控制、计费认证的层面。从中国来说,宽带用户一直采用PPPOE认证,因此这个层面产品主要是BRAS,未来随着FTTX建设和视频应用的推广,这个层面的流量将剧增,因此要求大容量。 同时由于全业务运营,RNC、安全、Wi-Fi,企业专线等业务都经过这个层面,因此产品形态的融合也是一个趋势。 在中国市场而言,BRAS这个设备,2.G和10G平台时代最成功的无疑是华为的MA5200系列,以及Juniper的ERX。思科在BRAS设备上无疑是它所有产品中最失败的一款, 丢失了这块利润丰厚的市场。
   上面说到,当前面临一个BRAS产品升级换代的好机会,华为的ME60,爱立信的redback,中兴的M6000都已经是40G平台,思科开发ASR9000就是为了应对这个市场需求,通过ASR9000将它的城域以太网产品和核心层路由器衔接上,组成一个完整的解决方案。 思科这款产品设计的容量很高,但实际上它用的不是CRS-1的芯片,而是用的商业芯片,估计是处于成本的原因。用的是EZchip的NP。 目前用的是20G的产品应该,单槽提供40G线卡,等100G的NP商用后估计会推出100G线卡。 这个产品在中国估计没啥竞争力,首先是产品价格没竞争力,再者现网很少思科的BRAS,现有的厂家的地位很难挑战。 但相信在国外还是应用市场广阔的,毕竟思科的其它产品竞争力很强,思科在国外运营商数据通信的影响力非华为可比。

注:ASR9K更应该是Aggregate的位置,而非BRAS?

(2个打分, 平均:5.00 / 5)

雁过留声

“浅谈ZTE中兴科技的路由器体系结构和相关产品”有9个回复

  1. 理客 于 2010-01-10 2:18 下午

    IP网络的流量架构来源于整个网络业务应用的流量模型,未来架构当然由未来的业务模型决定。最高层的骨干网的流量如何增长,现在看起来还是较快,但是到底将来会怎么样,不好说的,主要业务的主要发放点是不是要避免流量穿越骨干,这决定了骨干网的流量,从这个角度,电信业务的流量比较难成为骨干网流量的主流,成为主流的还是internet,而internet本身正式IP的缘起,电信的创新是有限的,但internet上的创新目前还远看不到头,所以是骨干网最大的流量来源,那么IP缘起internet,缘灭internet,但是这个流量是运营商利润率最低的流量,如果趋势是无法阻挡的,运营商想从internet业务中挖掘利润基本是很难的,那么一个是想办法提高电信业务的利润,另外一个就是对internet offload,以低成本,大容量,可用的QOS和HA的网络来承载internent,如果从这个角度看,将来的骨干网设备如何设计,是需要考虑的,但是除了技术问题,还有zhengzhi问题,目前骨干网的主流供应商很少,相当于几家垄断,没有人愿意做一款简单的低成本设备降低自己的利润,思科作为老大,为什么把CRS做成如何复杂,有技术的原因,但可能也有主观自觉和客观不自觉的zhengzhi考量,如果将来intentet和电信流量按照8/2原则的话,那么运营商建立两个网络的架构将是一个比较好的方案选择

  2. ben 于 2010-01-10 5:04 下午

    路由器集群方面纠正一点,思科和华为都已经发布2+8集群,现网也已经有2+4集群应用;而Juniper的集群其实分为两个系列,TX集群和TXP集群,前者基于T640路由器,最大为TX(1+4),相当于思科和华为的2+2;后者基于T1600路由器,目前最大为TXP(1+4),现网还没有正式应用,不过很快就会有国内案例。在市场份额方面,思科>Juniper>华为,不过估计华为很快就能赶上第二的位置。
    另外ASR9000不可能定位为BRAS吧。

  3. ABC 于 2010-01-10 7:28 下午

    原来首席也上C114啊,呵呵。要说当前火的论坛,除了天涯就是114了。
    从SR往上的市场,应该说国内的厂家还处在追赶的地位。
    看看整个internet核心节点的网络,大部分还不是在中国。市场驱动需求。
    ASR9K,我的理解是代替76的,但是也会面临当前65/76团队的against。思科的BRAS是10000系列,国内很少见。当然从产品在网络中的位置看,不能排除ASR9K代替10008的可能。
    7750就是一个很好的典型。

  4. 陈怀临 于 2010-01-10 7:33 下午

    C114上的几个小样还知道我去北研所。狠呀。
    你如果认识写这篇文章的几个家伙,把他们叫过来。当然,不排除他们已经穿着马甲在这里忽悠了。。。

  5. 黑猫 于 2010-01-11 6:38 上午

    算法查找芯片见下面介绍:
    http://info.51sole.com/d/72010.htm
    一般而言,算法芯片可作为Co-processor,集成到NP中去,例如NP3和NP4集成了M-trie和Hash算法。

  6. fastcache 于 2010-01-12 2:45 上午

    西安电信城域网上了NE5000E(2+4),
    上海电信城域网的Juniper TX(1+4)已经升级为TXP。
    AT&T应该已经有8个线卡框的节点,2010年电信也会扩到6个。
    按照Redback的说法,思科当年AS5xxx的衰败还是因为IOS,很长时间都没解决HA的问题。

  7. IXP2800 于 2010-01-13 5:50 上午

    文章不错,是内行。ASR9K定位应该是AGG位置,而非BRAS,不过CISCO自己说也要在ASR9K上集成PPPOE、IPOE的功能。另外,ASR9K刚发布了20G能力的SIP700,应该是基于QFP的。

  8. 陈怀临 于 2010-01-13 8:09 上午

    如果SIP700是QFP based,这可是significant的事情。我知道ASR9K的一个板子最近回来,但不知是啥东西。。。

  9. ben 于 2010-01-13 7:52 下午

    上海电信城域网的TXP还没到货呢