概念:
HA(High availability,高可用性)
NSF:
通常情况下,路由器故障后,其路由协议层面的邻居会检测到它们之间的邻居关系Down掉,然后过段时间再次Up,这个过程被称之为邻居关系震荡。这种邻居关系的震荡将最终导致路由震荡的出现,使得重启路由器在一段时间内出现路由黑洞或者导致邻居将数据业务从重启路由器处旁路,从而导致网络的可靠性大大降低。不间断转发技术的目标就是为了解决上述路由震荡的问题,为此,需要满足以下要求:
硬件要求:系统双主控RP冗余配置,即一块做主用主控板,一块做备用主控板,主用主控硬件要求:系统双主控RP冗余配置,即一块做主用主控板,一块做备用主控板,主用主控板重启,备用主控板成为新的主板;分布式结构,数据转发和控制分离,有专门的线卡(接口板)用于数据转发。
系统软件要求:主板正常运行的过程中,会把配置信息、接口状态信息备份到备用板;主备倒换的时候,接口板不需要重启,接口保持Up,接口板转发表不撤销。
协议要求:要求各相关网络协议,如路由协议OSPF、IS-IS、BGP,其他协议如LDP做扩展,具备优雅重启(GR)能力。
NSR:
NSR优点
- 不依赖也不影响对端设备,没有互通问题。
- 路由的收敛速度要比NSF快。
NSR工作流程
- 批量备份:NSR功能使能后,备板复位重启时,主用主控板上的业务进程会收到备用主控板上线的消息。业务进程开始进行内部数据的批量备份。批量数据备份完毕后,系统进入冗余保护状态。进入该状态后,如果主控板出现故障,备板升主后就可以利用之前从主板备份过来的数据进行升主,恢复业务。如果业务批量备份尚未结束时,主控板故障,备板升主后可能会因为业务数据不全而导致无法升主,因此这个种状态下无法完成NSR倒换,设备会整机重启,恢复故障前状态。
- 实时备份:完成批量备份后,系统进入实时备份阶段,在该阶段当邻居状态或路由信息发生时,主用主控板会实时将变化信息备份到备用主控板。
- 主备倒换:完成批量备份,进入冗余保护状态的系统,当主用主控板发生软件或硬件故障后,备用主控板会从底层应该感知到主用主控板的故障,并自行升主。升主后业务进程会使用之前从主用主控板备份来的数据进行工作。同时也会向接口板平滑倒换期间变化的信息。实现真正的路由不中断,转发不中断。在主备倒换端,系统支持NSR和GR两种不同的高可靠性保护,他们是互斥的。即,对于一个特定协议,系统倒换后,只能采用NSR或GR两种处理方式的一种。
NSF与NSR的区别:
参考资料:华为hedex文档