陈怀临时间–路由器不间歇转发(NSF)和不间歇路由(NSR)

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




(没有打分)

雁过留声

“陈怀临时间–路由器不间歇转发(NSF)和不间歇路由(NSR)”有27个回复

  1. kkk 于 2008-10-19 8:42 下午

    NSF解释个人感觉太牵强了,数据平面有自己的转发查找表,虽然与控制平面学到的表项有关系,但是它不会查找到上层去,毕竟一个是类软件表,一个是纯粹硬件表,所以当控制平面挂掉,需要数据平面保存那些控制东西比如路由表,TCP session的状态等等真有所谓意义吗?

  2. 陈怀临 于 2008-10-20 6:06 上午

    我有这样说吗?:)NSF的要求相对简单。只要控制平面尽快起来就好了,从而可以保证FIB不是无效。如路由都崩溃了,转发平面还在那傻兮兮的根据老的FIB Lookup就很可爱了。

  3. lubo1720 于 2008-10-20 6:59 上午

    陈首席:那个访问大米数好像不动了。

  4. 杰夫 于 2008-10-20 12:33 下午

    谢谢Lubo留意,问题已找到,已经解决。

  5. 陈怀临 于 2008-10-20 2:36 下午

    再读了一遍3K的评论。保持控制平面的TCP Session是一种NSR的动作,从而确保,路由协议的数据交换不tear down。 对NSF来说,确实不需要。

  6. softmaster 于 2008-10-20 9:00 下午

    两者对切换后恢复业务的时间要求不同。
    NSF的切换时间=数据面切换时间+控制面重新建立会话的时间
    NSR的切换时间=数据面切换时间
    两者恢复业务的时间间隔不在一个数量级上。一般来说NSF在秒级而NSR在毫秒级。
    而且NSR要比NSF复杂的多,尤其是对业务路由器而言。

  7. 陈怀临 于 2008-10-20 9:11 下午

    小S的总结非常好。是的NSR相对而言比较复杂。而且也没有一个标准如何做。不同的公司要去解决自己的问题。。。。。。

  8. jia 于 2008-10-28 7:42 上午

    GR应该属于NSF的一部分。
    同时不存在你说不同设备之间GR不兼容的问题,现在各个路由协议都制定了标准的graceful restart过程,各厂商只要参照标准即可实现设备的兼容性。
    NSR不需要使用GR,它是完全对路由协议数据进行备份,邻居完全感知不到设备的重启。

  9. 陈怀临 于 2008-10-28 1:51 下午

    >现在各个路由协议都制定了标准的graceful >restart过程,各厂商只要参照标准即可实现设备>的兼容性。

    从我的理解,GR是No Stop Routing的一种实现方式, 目的是给Dynamic Routing一段时间,不要立刻更新路由。

    当然,NSR目前更倾向于自己系统内部做状态的备份切换,而非赌在一个现场环境中你的邻居实现了没协议的GR Extension。

    所以有的厂商也这样定义:对于狭义的不需要路由器邻居感知和需要协议扩展(如BGP,OSPF。。。),叫NSR。对通过RFC,大家在路由
    协议上加扩充的,什么也不叫,就叫GR。

  10. voicefromhuawei 于 2008-11-25 7:37 上午

    陈首席有过很多精辟的言论,但是在GR/nsr这样的概念上应该说是比较混乱的。NSR和NSF都是系统级的概念(控制加转发平面),GR是协议级别的概念,是NSF的一个组成部分,和NSR没有任何关系。

  11. 陈怀临 于 2008-11-25 10:52 上午

    嘿嘿嘿,来自华为战友的“疯狂”(友善)进攻:)

  12. 陈怀临 于 2008-11-25 9:17 下午

    白天太忙。“来自华为的怒吼”说的有道理,又没有道理。有道理的是:如果你看Cisco对GR和NSF与NSR的定义,华为的怒吼是对的:-)。那又说了华为弟兄为什么又不对呢?原因是:工业界的东西非学术化。我录音里谈的NSR是一个广义的概念,是说GR也是为了解决路由协议崩溃的一种。。。。。。而思科或华为(好像还没有做出来:–) )谈的NSR是一种狭义的NSR,是指自己通过Duo-控制平面的高可靠性的容错技术,例如把TCP,Socket等状态做Active-Active的备份。

    再举一个类比。在操作系统方面,soft realtime,hard realtime。在工业界其实都是被误用。但大家知道其中说什么就好了。

    取其意,忘其形。方为无我只境界:–)。

    这么多年,第一次有人说我概念不清:-)。而且是来自华为。当然,还是首先肯定了我有过许多精辟的言论。谢谢。

    希望您能告诉更多的华为弟兄们弯曲评论,来这里讨论。。。。。。

  13. voiceofhuawei 于 2008-12-02 4:24 下午

    首先不能说是“疯狂的怒吼”吧,呵呵。可以说是来自华为的声音,代表了华为在NSR、NSF领域有过较长期实践的工程师的观点。偶然来到这里,看到一些文章,景仰景仰,虽然很多观点不敢苟同,呵呵。但就这篇文章而言,您的观点的确是很含糊的,是不太。。包括上面最新的comments.

  14. voiceofhuawei 于 2008-12-02 4:28 下午

    我想请教陈先生一个问题:为什么cisco在ASR1000上使用的是IOS XE操作系统,而到了新发布的ASR 9000上转向了IOX操作系统?个人感觉比较奇怪,按说一个产品序列应该沿用相同的操作系统才对。
    愿听陈先生发表一下高见:)

  15. 潜龙 于 2008-12-02 5:34 下午

    面向市场不一样,一个企业市场,一个运营商市场。

  16. 陈怀临 于 2008-12-02 9:44 下午

    “华为的声音”,你的14问题非常好。其中有市场的原因,如潜龙贤弟所言,也有技术的原因。我会专门撰写。

    我打算把SPP和这个Quantum Flow Processor都尽可能的分析一次。当然,以能收集到的资料为依据。

    多核芯片重要。但其实如何用一个40核的芯片比设计一个40核的芯片更重要(困难)。

    希望你部要充分考虑前面的困难,除了“人定胜天”的狼情。人有多大胆,系统就有多大产的年代毕竟是一场梦。。。。。。

  17. Fake-Einstein 于 2008-12-04 8:53 上午

    愿意听一下陈老师关于Cisco 40 core处理器的分析,非常同意您关于处理器使用的观点!

  18. aaa 于 2009-06-20 5:44 下午

    nsr不仅要backup RP,也需要backup FP.

  19. 李克 于 2009-08-22 3:57 下午

    无论NSF还是NSR等节点HA技术,还有各种简单和复杂的网络级保护技术,最终目的是提高终端用户的QOE.具体保护到多少性价比最高,情况比较复杂,比如我算好了,我故障的的综合损失,包括赔偿,包括后续影响,比我对HA的投入还少,我做HA干嘛.
    当然,无论如何,最好的HA就是把故障对整个系统的影响范围降到最小,最不容易被感知,目前控制平面备份就是做到的NSR,单控制平面内的备份,包括CPU核的备份,硬件部件的备份,软件进程的备份等,也是一套复杂的东西,转发平面的备份也有个别供应商的个别产品在做,甚至到接口卡端口的备份,都是成本呀.但从技术上,网络级的备份虽然情况更复杂,要相对实现起来要简单些,对客户来讲,最合适他的HA方案是对他来说性价比最好的方案,当然,这个理想状态是用来追求的

  20. ASR1K 于 2009-08-22 9:47 下午

    HA还是要做的, dataplane HA倒是好做, 特别是loadbalance的多FP架构上. 倒是ISSU有很多问题要考虑, 这些写code之前就要考虑清楚下一个release会改什么, 对后续的升级是否有影响. 这也是最难的几个部分. 另外对于控制平面俩看, TCP session保持, 似乎也有难度, 毕竟Active RP和 Standby RP有不同的接口. 所以才有了GR的出现. 然后对于FIB keep原来的转发表, 前面说过, Cisco用的是CEF上的一个version来完成的, 也是比较简单的处理方式.

    当然另一种做法就是在从电信网络转到IP网络时, 为了高可靠性的传递实现了基于SCTP的传送方式. 也就是说SCTP可以支持multihoming的处理方式, 而且SAck更加高效.

    旁路节点的处理方式也有, 原来是MPLS TE来完成FRR, 现在逐渐有IP FRR的出现. 也算是一种HA吧.

    总体来说HA真的很难, 也很容易出问题, 所以很多公司都会在产品上配备专门的system test人员来负责HA,performance, stress这样的测试.

  21. ASR1K 于 2009-08-22 9:52 下午

    回答一下voiceofhuawei, ASR1000属于Cisco Edge Routing Business Unit, 主要产品线是7200/73/74/76和10000系列路由器, 所以ASR1000其实是在CIsco IOS 12.2SR这个Branch上搞出来的, 并运行在了Linux之上, 而9K属于Cisco Core Routing Business Unit, 人家本来就是做CRS-1, GSR这些东西起家的, 用IOS XR也就是这个原因了,

    至于叫ASR, 主要是两者都放置于边界用于提供多种业务的汇聚功能, 所以叫ASR.

  22. 李克 于 2009-08-23 1:31 下午

    我理解:IOS XR在VR/LR,NSR,基于进程的模块可升级等先进技术,是否在边缘上有实际市场需求,是一方面考虑,另外一方面就是成本,用XR,并且能稳定兼容之前所有ASR的功能,高额成本是否能带来市场收益?所以,我,如果市场真的需要,XR移植到ASR1000,技术问题不是大问题,因为看不到市场需要,而TCO又太过,所以不急于用XR

  23. Simon 于 2009-09-11 3:19 上午

    感觉你说错了。GR不要跟NSR混在一起。GR需要GR helper,NSR不需要别人帮忙

  24. Simon 于 2009-09-11 3:23 上午

    ASR1K 很喜欢英文夹带中文哦:)
    建议改掉这个习惯,要么全英,要么全中

  25. 陈怀临 于 2009-09-11 6:13 上午

    西蒙,在双语环境里,就这样。有个邻居,中国人,在日本工作10年来的美国。两个小孩。说话是中,日和英混杂。经常一句话里含3国的词汇。

  26. david 于 2009-10-11 7:11 下午

    请教一个关于CISCO ASR1000的一个问题,配置了TE功能,用静态路由打通,隧道已经UP,但是在头节点转发不通,请问是否有特殊的转发命令或者什么配置未配?多谢指教!

  27. 陈怀临 于 2009-10-11 7:18 下午

    大卫可真能翻。把我这个都顶出来了。这些有许多思考的ASR1K。等着吧,一会儿就有人回答你。或者就是美国的星期一。ASR1K们反正上班没事:-)