思科核心路由器CRS-1的研究(上)

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




1. 前言:

在通信领域的高端设备上,核心路由器历来是皇冠上的珍珠。本文对思科的核心路由器CRS-1体系结构,CRS-1的SPP网络处理器,和相应的IOS-XR操作系统方面进行探讨,力图把一个高端核心路由器的整体全貌分析,解释给有兴趣的读者,从而使得读者能够对CRS-1的体系结构有个整体的了解和把握。

此文不允许被转帖,下载和应用在任何商业途径(目的)和(或)商业公司研发中;对于教育(Education)和非赢利性(Non-Profit)的目的,可以自由转帖,下载和修改。本文遵守自由软件GNU Free Document License的文档条款。关于GFDL的细节,可参阅GNU站点GFDL条款

【下载 思科核心路由器CRS-1的研究(上)

(2个打分, 平均:5.00 / 5)

雁过留声

“思科核心路由器CRS-1的研究(上)”有60个回复

  1. 欢迎访问陈怀临空间。 : 弯曲评论 于 2009-07-23 9:31 下午

    [...] 《 思科核心路由器CRS-1的研究》(上)(PDF全文下载) [...]

  2. 陈怀临 于 2009-07-23 9:48 下午

    在PDF文件里,我把参考文献列出来了。大家有兴趣的可以去阅读思科的文档。但我自己感觉,应该是读我的东东比较好。我的东东加入了大量的从系统架构师的角度的剖析和阐述。而且把CRS-1作为一个系统来讲解。

    我有信心,这是世界上,除了思科内部的设计文档规约,对CRS-1解释的最好的文章。

  3. HW 于 2009-07-23 11:53 下午

    为什么陈总发表的都是对思科的产品看法的,HW或是H3的虽然差,但也可以说一下啊

  4. 帅云霓 于 2009-07-24 1:41 上午

    回复3楼:你觉得做Nokia这样名牌手机的大侠,会把销往亚非拉第三世界的山寨机放在眼里吗?

  5. IP+Optical 于 2009-07-24 2:05 上午

    非常感谢陈总的工作,让我可以缩短阅读原文的时间并加深对系统的理解。

    @HW
    陈总是通过公开资料来研究和分析的。貌似HW和H3的公开资料不够透明和全面?

  6. lte 于 2009-07-24 5:23 上午

    期望楼主写一个软件架构解析,

  7. 陈怀临 于 2009-07-24 8:27 上午

    得,我成陈总了:-)。我是陈首:-)

    我会慢慢写到软件架构的。关于HW或者H3,基本上没有资料。HW的东西有点像在“躲猫猫”:-)。

  8. HW 于 2009-07-24 7:41 下午

    哦,陈首长!我觉得如果这个网站以普及网络软件架构为已任就更好了.现在很多文章基本上都要有很强大的基础理论知道,普及一点的东西没人写的.HW和H3不是有培训代理的PPT吗?

  9. HW 于 2009-07-24 7:42 下午

    网络软件硬件架构和怎么去评价一个路由或是交换机.低端的东西也没有人写

  10. 陈怀临 于 2009-07-24 7:57 下午

    谢谢HW。你的建议很好。代陈首长象正非同志问好。。。
    是的,我会持续朝通信系统,CPU,操作系统,云计算方面发力。

    我的个人精力,兴趣都有局限性。一定要大家参与进来。

    勿以善小而不为。这一点非常重要。需要强大的自制力和毅力。希望大家共勉。

    风华名利,皆为过眼云烟。唯有多播善果,招福他人,方能小之福荫家人;大之成就霸业。

    共勉之

  11. NYL 于 2009-07-25 2:48 上午

    支持陈首席的设想,这里以前瞻性而吸引很多朋友,
    ps:思科Networkers2009预测的8大趋势:
    1) 云计算的普及与拓展
    2) 虚拟化的普及与整合
    3) 承载网的多媒体化
    4) 设备设备专业化
    5) Network as platform
    6) 通信协作平台化
    7) 绿色(Green)
    8) 技术的进一步整合

  12. aaa 于 2009-07-27 10:34 下午

    辛苦了首席。

  13. michael 于 2009-07-28 12:37 上午

    写了封mail给首席,关于海思k3的,从目前实际测评来看,性能很强,很省电,变频率运行。
    详细见mail,请查收。呵呵。

  14. nobond 于 2009-07-28 8:51 上午

    a. 消费类芯片也是首席关心的马?
    b. 技术分析公开一下何妨?

    彩电
    写了封mail给首席,关于海思k3的,从目前实际测评来看,性能很强,很省电,变频率运行。
    详细见mail,请查收。呵呵。

  15. Tek 于 2009-08-13 5:39 下午

    请教陈首席:
    Cisco采用Midplane,系统互联时光纤通过rear侧来互联;像H等公司采用backplane,互联时光纤通过front侧来互联吗?

    可否讲解一下具体如何来做?

  16. 陈怀临 于 2009-08-14 6:14 上午

    阿岩,你来回答一下这个问题。这种问题难道还需要首席科学家来回答吗:-)?(因为回答不出来:-))

  17. 黄岩 于 2009-08-14 6:51 上午

    目前只有CIsco、Huawei、Juniper三家有集群路由器,一台路由器由多个框共同构成。就是一个交换框加上几个线卡框,交换框和线卡框之间通过光纤互联。

    一般来说,一台普通的单机版路由器,把中间的交换卡换成光互联卡,就成了“集群”的线卡框了。也就是单机版路由器的交换卡在哪里,光纤就应该从那里出来。

    普通单机版路由器的交换卡有到所有线卡的高速数据信号,光互联卡的作用就是把这些电信号转换成光信号。

    这个东西的难点在那个光器件上,也就是那个有很多跟光纤的光模块。要把这些光纤都同时对准激光器和光敏元件,不是一件容易事。

    那个激光器也有点特殊,一个硅片上有很多激光器,用普通硅工艺一次制造出来的。学名叫作:垂直腔激光器,VCSEL。似乎这东西在超级计算机上用的比较多。

  18. ASR1000 于 2009-08-14 10:30 上午

    我记得Avici是有cluster的, 而且是基于IXP的互联结构, 立体的互联结构(3-D torus topology ). 大致可以参考:

    http://www.avici.com/technology/whitepapers/TSRfabric-WhitePaper.pdf

    对于光互连, 见过CRS-1的 FCC S2卡和LCC S13卡就很明显了. 光互连结构非常明显.

    至于下一代光交换矩阵Nick McKeown教授(设计GSR架构的那位)正在做一些基于MEMS的光交换矩阵的研究,

    具体如下文档:
    http://tiny-tera.stanford.edu/~nickm/papers/ecoc_2003.pdf
    http://yuba.stanford.edu/techreports/TR03-HPNG-080101.pdf

  19. ASR1000 于 2009-08-14 10:36 上午

    光纤互联倒是很无所谓前后的. 反正原理无非就是单机箱模式下卡上存在完整的三级结构. 然后在进行多机箱扩展的时候再转而将原来的第一级和第三级连到外置的第二级上. 光纤从哪出倒是主要看第一级和第三级的位置是啥

    后背板结构怎么在后方引出光纤来? 当然只能将其放在前方. 而中背板结构, 第一级 第三级都在后背板侧, 那为什么要把这些光纤接口做到前方呢?

  20. ASR1000 于 2009-08-14 10:48 上午

    这篇文章的确写的不错, 但要说是最好倒不能算.

    加上一些Cell 如何self-routing , 然后组播Fanout如何做的. 为什么S3会有2块, 这些其实都是很好的议题, 不看design spec也会有相应的解决方案的. 还有最关键的SPP.

    http://www.cs.ucsd.edu/~varghese/crs1.ppt

  21. ASR1000 于 2009-08-14 10:56 上午

    还有一个题议就是可以写一写Benes和CLOS的区别, 特别是cisco在OM上两个S3和Juniper CLOS Tx-matrix 在组播性能上的比较. 以及一些调度算法的比较以及缓存放置在3级中的哪一级(现阶段基本上是MSM). 调度算法, Random dispatch 和CRRD之间的区别. 加速比各自需要多少?

  22. 陈怀临 于 2009-08-14 1:05 下午

    狠人天天有,今天来最多:-)
    ASR1000,要多来指导。

  23. maja 于 2009-08-14 7:26 下午

    to 帅哥:
    “还有一个题议就是可以写一写Benes和CLOS的区别, 特别是cisco在OM上两个S3和Juniper CLOS Tx-matrix 在组播性能上的比较. 以及一些调度算法的比较以及缓存放置在3级中的哪一级(现阶段基本上是MSM). 调度算法, Random dispatch 和CRRD之间的区别. 加速比各自需要多少?”

    很想学习学习,很好的建议啊,首席。呵呵

  24. maja 于 2009-08-14 7:38 下午

    为何CRS-1多机箱FCC和LCC之间的距离最大100m?受何技术限制呢?

  25. ASR1K 于 2009-08-17 7:10 上午

    FCC和LCC上本来功耗就大, 长距离模块将更加消耗整机功率. 整机散热也将成为一个很难解决的问题. 然后记得FCC 和LCC之间是光纤矩阵. 也就是说一根cable上实际上是并列多条光纤. 因此相关光接口处理也很麻烦. 那么再来看光缆之间同步的问题, 长距离这么搞也存在难度. 再说, 为什么要支持长距离的传输呢? 长距离直接DWDM接在ROADM上边跑LCC之间的路由好了, 还组成cluster干嘛? 真的有这么大的流量需求么?

  26. 李克 于 2009-08-22 6:39 上午

    拜读,很牛。
    CRS的功耗和体积实在是没法说。如果不能改进,前途不知道。如果C解决了上面的问题,同时其NP的代码空间足够大,能支持更多的业务,那前途无量,否则是吃老本生存

  27. ASR1K 于 2009-08-22 11:45 上午

    李克先生倒是对C研究很深. 对于CRS-1的抱怨其实已经很多, 体积/功耗太大, 大多数运营商都在抱怨. 而功耗问题实际上已经开始做了. 一个很大的全Cisco系列的项目, 叫green xxx research, 一方面从ASIC设计入手, 另一方面则是周边器件功耗. 当然还有一些虚拟化的技术, 但是要取得成效, 估计一时半会看不出来.

    而NP代码空间, 从个人的角度来说, 完全够的. 架构决定的.

    但是现在也有一些顾虑, 就是到底该不该在核心网上支持更多的业务? 比如专门的语音视频承载. 专门的一些业务流处理等. 还是推送到边缘? 所以我倒是觉得承载网和传输相关的feature可以多做, 而一些不必要的feature可以少做.

    另外, 最近大多数人都在关心Data Plane, 而忘记了Control Plane上的一些升级换代. 怎么说呢, 前几天在ASR1K的两代RP上开发一些东西. 感触很深. 2代是X86的, 一代是PowerPC的, 2代快了很多倍. 原先以为Juniper用X86做并没有太大的优势, 而且X86很不稳定. 但现在来看, 的确做得很不错. 总体来说, Cisco也在往X86 RP上挪. ASR1K和9K都有了, Nexus 7K也有了, CRS-1过不了多久也会有X86的RP. 这倒是个趋势.

    另一方面, RP有分布式的趋势, 相当于来说 多个RP使用一套API来控制FP. 这也是未来几年的一个趋势. 最明显的就是C/J等厂商都有3GPP-BGF的功能. 然后由软交换或者其它的控制器来建立流量转发. 这是下一代路由器很重要的一个功能. juniper叫BGF, 而Cisco叫DBE, IOS XR和IOS XE都有, 这也就是您说的一个NP的feature. 用来干什么呢, 也就是说任何两个不同VRF的人或者完全不相干的两个终端要进行转发. 原来的做法是把路由搞通, 通过 匹配 RT 导入路由到VRF. 但这样做不安全也不搞笑, 现在就是基于流量的, 谁要用, 控制平面下放一个消息就可以在路由器的两个接口的特定端口之间建立一个逻辑转发隧道就行了.

    至于控制平面, IOS XR还提供Multicast IPC的支持, 这也是比较新颖的一种处理方式. 但稳定性, 代码复杂度如何, 难以知晓, 只能让用户来检验.

  28. ASR1K 于 2009-08-22 11:47 上午

    另, Juniper JCS1200做的不错, 直接使用了IBM的 H系列刀片服务器来和 T系列的转发平面互联. 但是唯一的缺点是, JCS1200上有几块卡打的是Nortel的logo… 呵呵..

  29. 李克 于 2009-08-22 1:19 下午

    兄弟的技术功底很深,长见识了,我不行,只能忽悠
    1、NP代码空间问题,可以通过license控制不同的功能代码下发,但实际实现和市场应用,限制很大,这一直是NP的一块心病,或者根据实际配置的功能事实下发NP代码,但这个方案,NP支持起来有些难,包括实际上在线更改配置,还要保证业务不中断,不好做,不知道是否有更好的方案
    2、分布式RPF很好,能给客户的网络带来什么实际收益呢?客户为什要用呢?似乎不是很明显,但我还是看好它
    3、关于转发平面如何参与业务和应用控制,这是电信IP话的一个重要研究方向,分歧很多,需要更深入的研究和实践

  30. ASR1K 于 2009-08-22 9:23 下午

    1. cisco其实lic做的很少的, 都是trust mode, 所以IOS之类的虽然有license的收费, 但实际上你用了额外的功能, 或者私自download了全功能的IOS image, 也不会有人管. 所以这也是Cisco一些ISR卖的好的原因. 特别是那些语音网关. 在线更改配置其实好做的, Cisco很早就在CEF转发里面做了一个epoch值来控制刷新. 然后根据epoch值逐条将高的替换掉低的. 这样更改配置实际上就比较平滑一些了.

    2.分布式RP主要是一些控制信令需求很大, 以前电话网有的SS7这些信令网关换到VoIP上就是SIP/H.323这些信令协议. 然后video点播也需要参与一些组播控制. 作为MPLS PE, 可能也需要多个进程来管理不同PE-CE路由, 然后在此基础上不能影响核心网的IGP, BFD, BGP这样的功能. 还有包括提供一些集成的PPPoE这样的BRAS业务, 都需要控制平面的资源. 根据不同的资源采用不同的RP是个不错的解决方案. 这里Cisco又做了一个投机取巧的工作就是不同RP之间通过组播IPC进行通信.

    当然不得不说的是, J很早也有了logical Router的概念, 而Cisco也有LR和SDR的东西, 相对于VRF的处理方式, Logical Router在某些功能的支持上可能会更完善一点. 反正这种东西设备商肯定到时候会炒作称为 云路由器 的概念, 就像C现在推广的云防火墙一样.

    3. 3Gpp有很多Spec来描述的, 大规模的部署NTT是第一家, 用的就是ASR1000. 其它的未知, AT&T再考虑是否部署…

  31. 李克 于 2009-08-23 2:45 下午

    ASR1K,厉害,对业务网关尤其是语音好精通
    1,许多厂商的LICENSE其实大部都是代码全download.C的CEF好像是基于流的快速转发,非逐包路由转发.还要做到NP的代码加载类似windows DLL一样,好像还没有NP能支持.对于路由器,所有的L2/L3/TE等等功能都由NP实现,在40G速率情况下,代码空间限制如何解决?
    2,分布式RP用于信令处理负担太重是重要理由,不是市场直接驱动,是解决技术问题.LR用途很多,随着大T的扩张,和固网移动的融合,可能LR显身手的时候快到了
    3,城域网和核心网路由器上如何做基于业务的管控,包括IPTV,P2P等等,涉及NETFLOW,LIF,DPI,内容缓存等目前基本的技术,这些东西核心还是在转发设备如何参与业务控制的问题
    4,X86因为是IT的核心海量CPU,所以进步速度是RISC不能比的,性价比很高,这一点可能大家都是清楚的,浮点强整数弱的弱点,可能站不住脚,但也许正是因为其进步太快了,升级太快了,所以通信厂商在觉得RISC能够胜任的情况下,不想多用X86.目前的RP板,除了RISC/MIPS的多核CPU,X86也是一个需要好好考虑的选择

  32. aaa 于 2009-08-24 7:22 下午

    “2代是X86的, 一代是PowerPC的, 2代快了很多倍. 原先以为Juniper用X86做并没有太大的优势, 而且X86很不稳定”

    这个不稳定是怎么比较出来的? 功耗差别大吗?

    cisco做IOS的有一个fellow,好几个DE,总得搞点创新的东西出来啊,不然epm怎么写啊,嘿嘿。

  33. TNC 于 2009-08-24 8:00 下午

    印度人的脑子不好使,那是出了名的。当然跟我们一样也会有个别特别好使的。但平均上来说,他们写的代码繁复冗长,设计不合理,通常能把自己绕进去。

  34. 陈怀临 于 2009-08-29 8:06 上午

    阅读了ASR1k,黄岩,李克等等等读者的评论和见解,我心中的感触就是:人外有人,天外有天。《弯曲评论》能够提供一个平台,使得大家在一起,陈首席心中非常高兴。

    从评论可以看出,你们在工作中,都是公司的骨干或者是领导人员。 希望你们多多指点。大家一起把《弯曲评论》推向成功。

  35. Simon 于 2009-09-09 7:46 上午

    陈先生您好。阅读了您关于CRS-1的研究文章,很佩服。您都是根据思科网站上的资料自己研究的吧,这一点让我非常佩服。。。
    我是华为的一名数通销售人员。
    你可能对华为的数通产品关注不多,我想告诉您的是,多框集群华为已经推出全球首个2+4集群,并在西安省干成功商用,另外多套2+2集群在新加坡,江苏,甘肃,西安国干等地方也将陆续上线。你太高估国内厂商跟思科的差距了。
    另外,关于您对集群的研究,发现您关注的还是交换平面,这个当然是最重要的,不过很希望您能推出控制平面,控制通道选择方面的研究文章。相信对我这样对路由器架构有所渴望的人肯定受益匪浅。
    非常感谢!

  36. ASR1k 于 2009-09-09 8:24 上午

    congs for Simon and HW. for the control plane . any special design need ? all the dataplane only need 1 FIB.

  37. Simon 于 2009-09-10 5:05 上午

    我说的是思科的各个主控板之间是怎么通讯的?特别是FCC上面的主控和SCGE,LCC上面的主控板,这三者之间的通讯。
    有多少通道,如何选择通道等等。

  38. Simon 于 2009-09-10 5:07 上午

    ASR1k 兄有兴趣加我QQ吗?87120422 我测试华为的多框一年多了,不过对于思科的多框还是有很多疑问,不知道能否向您请教下?

  39. Simon 于 2009-09-10 5:09 上午

    对37楼问题的补充:特别是FCC 不止一个的时候,控制平面的问题会变得复杂一些,我觉得还是有必要弄清楚的。至少华为的多框设备,控制平面和交换平面都还是很关注的(当然重点还是交换平面)

  40. ASR1k 于 2009-09-10 5:44 上午

    hehe , 我只说该说的而已.
    至于多个FCC, 为什么是是8个. 8个FCC之间有什么区别呢, 其实没区别. 点到为止.

  41. Simon 于 2009-09-10 6:16 上午

    8个FCC之间当然没有区别。你没有听懂我的问题。不知道你对集群系统了解多少,我只是希望有兴趣可以真诚讨论下。不知道你是不是思科的员工。思科是个开放的公司,我想他在整体架构上的技术也没有必要保密。因为用户肯定会知道,HW肯定也会知道。我为什么不知道,因为以前没关注,也不是HW里面设计多框的那群人。仅此而已

  42. mpc8240 于 2009-09-10 11:27 下午

    从通信人家园转贴过来一篇。FYI only:

    唯有杜康
    作为数据通信的老兵,看了楼上这些回复,实在看不下去了,不得不说几句,有问题请大家指正。
    1.什么是集群路由器
    目前高端路由器都是40G平台,单槽40G单工,双工80G,8槽640G单工,就单台设备来说,目前CRS-1、juniper的T640 、阿尔卡特的7750、华为的NE5000E都是这样。集群的概念是这些路由器的原先的交换矩阵只局限于本机框内互联,现在可以将交换矩阵独立出来作为一个机框,提高容量,而另外配置一个线卡框作为业务处理,线卡框和交换框通过光纤互联。集群和背靠背连接的区别在于,前者是交换网间的互联,而后者是业务板卡间的互联(比如40G/10G业务接口互联)。当然,juniper和Cisco的交换框和线卡框之间的设计思路和实现方式不同。
    2.目前商用的集群系统
    商用的集群系统,真正意义上的是Juniper的TX matrix 和Cisco 的CRS-1,最主流的应用是2+2,也就是2个显卡框和2个交换框, 按照设计,TX matrix和Cisco CRS-1 虽然交换网部分架构有所不同,但都是2个交换框最大支持8个线卡框,即2+8, 2+8=8+64,这不是简单的小学数学题,硬件和操作系统的要求高了很多不说,还涉及实际应用需求和工程施工、运营效率等问题。因为集群系统不单单是芯片研发难度大,硬件设计困难,多设备的操作系统难度也很大,因此很多先前的项目都是两个CRS-1和T640背靠背连接,华为的 NE5000E目前真正商用的所说集群就是这种。 就应用范围来说,TX matrix 和CRS-1在美国和西欧应用较多,AT&T就有好几十套CRS-1 2+2集群。 国内现有的集群主要是联通和电信的骨干网7大核心节点和各省市出口, 主要是CRS-1和TX Matrix,而NE5000E虽然宣称自己是集群,但在联通和电信的实际项目中都是背靠背, 不过为了压低CRS-1和TX Matrix的高昂价格,电信和联通愿意引入华为,虽然我们国家的高端路由器的确有差距,目前一套2+2的系统,CRS-1和TX Matrix要近3000万,华为的估计1000万不到,虽然人比人得死,货比货得扔,但没办法,谁让咱中国人便宜呢?
    3.40G和100G线卡
    现有高端路由器40G线卡只有40GPOS 卡和思科和juniper的波分卡,100G还没出来,也没实际需求,100G同样也是个涉及标准、软件、硬件和应用场景的技术,没那么快。集群路由器要是从40G平台升级到100G平台,需要更换交换板、引擎。 100G ready这种说法,各个设备商都在说,这个没什么神秘的,大家都支持。
    4.关于中兴的T8000
    目前没看到实物也没见过具体资料,不过有勇气有能力搞这个东西,至少说明中兴这几年在数通上的确有了进步,是下了血本,费了力气,勇气可嘉,楼上一些兄弟看到这个不分青红皂白,好像要除之而后快,我觉得大可不必,毕竟这个市场还是实力的比拼,能活下来的都是强者。其实集群路由器的最难的还不是高速ASIC芯片,最难的是操作系统,这个不论中兴还是华为,比思科的XR 和juniper的Junos都有较大差距,未来10年,互联网流量将几何级增长,集群路由器作为网络的核心和纽带,市场需求将进一步增加,希望在这舞台上的不再是cisco和juniper的二人转,希望中兴的T8000和华为NE5000E不再是伴舞,而是主角。

  43. Simon 于 2009-09-11 2:58 上午

    我今天从公司弄到最详细的系科CRS-1硬件架构资料了。
    比楼主写的详细多了,^_^

  44. 李克 于 2009-09-11 4:30 上午

    Simon,你在这里馋人可太不厚道了:)

  45. 陈怀临 于 2009-09-11 5:46 上午

    Simon,看在我这么多年做非赢利性工作的份上,给我来一份 to huailin@tektalk.cn. 谢谢。BTW,华为狠呀。天下没有华为得不到的东西。。。我估计CRS-1的源码也有。

  46. Simon 于 2009-09-11 7:36 上午

    在我的便携机上,可是我不能拷出来啊,公司电脑都装了个小软件,拷出去的东西都有记录的,
    不过我倒是可以一张一张的拍照。。。呵呵
    改天我有时间整理下吧,我也挺想留一份的
    其实你将的也差不多了,就是一些细节没说清楚,还有控制通道,你真的没讲到。还有juniper的多框,其实基本架构都差不多。。。

  47. ASR1k 于 2009-09-11 10:50 上午

    J: CIP = C: SCGE
    J: JCS = C: DRP
    J: Matrix = C: FCC
    J: TX-FIB = C: FCC-S2
    J: Txx-SIB = C:LCC-S13

    J: Control plane:
    http://www.juniper.net/techpubs/en_US/release-independent/junos/topics/concept/control-plane-tx-matrix-plus-architecture.pdf

  48. 陈怀临 于 2009-09-11 11:03 上午

    我在谈FCC的时候,确实没有涉及控制通道。主要是觉得不是Data Path的东西。你说的很对,这其实对你的工作,网管人员其实很重要的一环。我写的这个东西主要还是从工程师的角度的。。。

  49. 大荣 于 2009-11-09 6:25 上午

    粗粗看了一下,没有仔细看评论。
    我觉得大集群的路由器,比如思科、juniper还有avici和华为的,包括现在中兴的。体系架构设计好不好是一方面。
    当时我去采访的时候,我觉得是这样的大集群路由器能够给组网模式带来的变化很重要。我当时在报道中提到CRS-1带来的一个变化是把路由的组网推到了类似程控交换的组网模式,这个说法现在想想还是有些道理。不过还是比较片面的。
    CRS-1当时设计集群和虚拟路由的时候有一个考虑,就是一个pop点里看看能否实现一个大集群取代一堆路由器的组网模式。比如过去有的时候一个大一点的pop点里既有Edge的router,还有core router,而edge router和core router有时候很多接口是为了互联用的,比较浪费,而且还要浪费地址空间,做一定的路由配置和宣告。
    不知道这里搞程控交换的朋友有没有,当时设计有一种接入网产品,使用v5接口,其实是一个传输加接入的设备,其实我觉得那个比现在的IP网过多的路由器产品要好和合理。
    今天看了何博士的一篇写IP地址分配的文章写得很好。弯曲评论好像做设备的很多,都爱考虑硬件如何做,软件如何写,关注盒子内的问题,真不知道国内有没有一些人从大网的角度考虑一些问题。我觉得华为公司该随着做大网的经验不断增加,从整网和整个业务层面做一些创新,这才是赶超思科的路数。
    以前华为他们在传统语音领域做了不少创新,期待啊!

  50. 陈怀临 于 2009-11-09 6:38 上午

    小荣,这是你混入本坛来写的最好的一个评论。其他多为属于灌水范畴。为啥涅?首席今天在飞机上也在反思你说的事情。

    是的,许多技术人员,包括阿拉我自己,都技术感兴趣,一谈一个产品,最后就栽倒细节里。

    这其实有问题。

    例如,为什么需要CRS-1,service provider在有了CRS-1之后,在depolyment方面有什么提高,解决了什么问题。ASR9k是好。但从网络拓扑的角度,为什么需要这个aggregate。在metro eth的市场上,ASR9k是如何定位的。如何在产业链上,为人省钱和赚钱的。。。。?

    这方面如果不去钻研一下,其实就是没有真正把握一个产品。这也是PLM和Marketing的人有时看不起Engineering的原因之一:做但不知道为什么做一个产品。成为了人家的一个labor。

  51. 阿来 于 2009-11-09 7:44 上午

    在我的便携机上,可是我不能拷出来啊,公司电脑都装了个小软件,拷出去的东西都有记录的,
    不过我倒是可以一张一张的拍照。。。呵呵
    改天我有时间整理下吧,我也挺想留一份的
    其实你将的也差不多了,就是一些细节没说清楚,还有控制通道,你真的没讲到。还有juniper的多框,其实基本架构都差不多。。。
    —————————————
    Simon小心信息安全哈,呵呵。
    H的二拖八据说目录价是一个亿~~~,
    还有关于控制通道,这里有一个专利,可以参考参考:
    http://www.soopat.com/Patent/200910077734

  52. Jie 于 2009-11-09 5:36 下午

    机器关机, 拆硬盘下来, 接在一个支持SMB的无线路由器上, 然后再用带WIFI的手机访问…
    现在进出入搜身? 如果不是的话, 可以带个无线路由器, 或者申请重装系统的时候.. 反正有的是办法.

  53. 大荣 于 2009-11-09 7:12 下午

    To陈首席
    小弟已经远离一线许久了,能够得到您的褒奖真是谢谢。
    不知是否还记得我在Juniper换logo的文字里写得东西,可能开玩笑的程度太多了,所以……
    想象力,我很看重想象力,思科我给好评的一些产品,是因为想象力,比如CRS-1,比如ASR 9k 1k里的一些功能。
    我敬佩华为是因为华为的A开头的08机,做拨号接入服务器的,类似思科的AS5300以及3com的total control系列或者ascend的产品。华为那个超大的接入服务器,太有想象力了。后来也证明,国内打败天下无敌手。而且当时他们在国内布网的思路是把拨号上网迅速在C5局或者C4局旁路掉。这个思路很有想象力,因为当时IP拨号上网的通信与电话通信不同,电话3分钟,拨号上网10分钟。带来的问题不仅仅是ISP所在局向的电话呼叫拥塞,而在汇接局就会出现拥塞,甚至导致汇接局到ISP所在局向的中继线大规模拥堵。
    IP网上是否也有类似的问题呢?抱歉不做采访太久了,不知道了,不过中国的运营商也在做网络规划的扁平化,我想是有一定道理的。
    不干活就容易忘东西,已经把爱尔兰数咋算的都彻底忘光光了!

  54. 黑猫 于 2009-11-10 5:57 上午

    如果,将LCC与FCC之间的100米换成80公里,ROTER世界将怎样?
    大荣提到“CRS-1带来的一个变化是把路由的组网推到了类似程控交换的组网模式,这个说法现在想想还是有些道理”。但是,现在三家Vendor能实现的互连光缆距离是100米,这与程控交换机组网模式还有很大差距。
    在程控交换网络中,一个大容量交换端局(即CO)可以通过多个V5.2接口挂接众多的由OLT和ONU组成的光纤接入网形成广覆盖,以替代众多的中、小容量局,简化网络拓扑,从而大大降低管理费用。这些OLT/ONU在物理距离上与端局相差几十公里,但逻辑上仍是一台设备,是真正的分布式组网。
    反观现在的Multi chassis,仅仅有区区100米,多个机框仍只能放在一个房间。
    如果FCC与LCC之间的距离可以达到80公里,则POP点变成一个由多机框跨地理位置组成的分布式系统。一个欧洲小型城市,使用一台Multi Chassis设备即可覆盖,网络层次扁平化,免去了OSPF/IP地址分配/路由宣告/VLAN ID等规划和管理之烦恼。同时,将传统的线卡互连变成了网板互连,大家都知道网板比线卡便宜很多。这是否很有意义?
    当然,Multi Chassis的CLOS组网要求星型连接,与V5.2接入网的环状/树状/链状等等组网模式相比还是少一些灵活性。但我想星形组网传输问题可交给DWDM/OTN等到光传送设备去解决。
    80公里是否有价值?技术革新是需要商业价值驱动的。

  55. bigrong 于 2009-11-10 6:22 上午

    黑猫说得很有道理。
    其实我只是在外面猜测,或者是臆想。我觉得如果多机架只是解决一个机箱处理能力不足的话只是暂时有意义,未来的意义不大。比如Juniper推出了T matrix,之后又有了1600,究竟选择哪个好呢?T matrix的意义在哪里呢?
    80公里我觉得还是很有意义的。就像我想为什么就不能在数据中心,思科做一个类似CRS的多机箱系统,而不是Nexus 7000。不过后来别人给我讲了Nexus 5000和nexus 2000的时候我就觉得厂商在做的时候在找一个平衡点。(考还欠人家篇内部东西)。
    如果能够实现程控的做法,那就会很大的简化网络的拓扑结构了。但是我觉得其实又很难,除了技术的问题还有政治和商务的因素。v5毕竟是个ITU的标准,中国特别在这方面做了很多的标准化的努力。
    据说不能做那么远,好像还是高速传输信号的时候的问题。
    另外,如果思科真的实现多交换网版机箱的互联,就不是简单的星型链接了。也就是哪个92T的连接。其实在交换网版的机箱之间他们还要做mesh链接的,内部会有协议来做。但是那是一个终极目标。2004年的时候听他们说的,看来做起来并不容易。不知道陈首席有没有专门分析CRS-1互联机箱的部分内容。时间过去有近5年了,当年他们给我讲的东西我忘记了大半了,那时候没有写blog的习惯。
    想想能不能做一个这样的设备,内部靠类似dwdm的ring互联,转发层面走单独的信道,外面则是一些类似的路由器,但是内部互联网全是私有的协议,类似现在交换机的cluster,比如c、j、h3c以及一些star up做得方式。不过这样又有点类似当年ATM里的一种IP做法了,叫啥来着,可能得去北电的网站上找找了。就是外界是路由,里面是ATM的高速交换。

  56. bigrong 于 2009-11-10 6:30 上午

    另外,还有个问题如果按照程控交换的做法,且不用讨论80功力还是100米的问题。我觉得根本没有必要发展诸如7600和ASR9000的产品。
    或者说至少CRS-1这样的设备上需要有一些支持业务功能的板卡。
    所以,我的想法是臆想。

  57. 陈怀临 于 2010-04-14 3:58 下午

    YY一下。今天发现在李彦宏的地里,search “路由器 crs-1”。我的文章排第一和第二:-)

    http://www.baidu.com/s?bs=crs-1+%C2%B7%D3%C9%C6%F7&f=8&wd=%C2%B7%D3%C9%C6%F7+crs-1+

    谷歌上排第2和第5.

    也奇怪,如果把“crs-1″和“路由器”换一下。结果就不一样。。。

    这说明search engine不智能化。

  58. 小兵 于 2010-07-07 5:51 下午

    首席对CRS的交换平面的解释是不是有点问题呀,CRS有8个交换网卡吗?

  59. 小兵 于 2010-07-07 5:54 下午

    sorry,还真是8个,:)

  60. alexzzp 于 2011-03-05 6:06 上午

    TO everybody:

    我是一名在校的研究生,能结实到这么一个有趣的“技术”论坛真是感到开心。我也是研究通信设备的,前段时间主要集中在搞交换结构,不过从书堆paper堆里走出来,认真看了陈首席的CRS-1的分析后,还真是感到学界的东西跟产业界的区别有点大啊。
    不过陈首席的文章里面似乎没有讲到交换结构里面最重要的路由和输出争用的调度算法,不知道CRS系列的公开资料有没有提到这两点。

    (推荐一本关于交换结构的好书:
    《高性能交换机及路由器》(High Performance Switches and Routers)PDFhttp://www.verycd.com/topics/183654/)
    这本书基本把路由器里面的方方面面都讲到了,特别是总结与归纳了几乎历史上出现过的所有交换结构(就差了现在我们在研究的代数交换结构了)推荐给大家:>)