MPLS TE可靠性


可靠性概述

对于MPLS TE隧道而言,其可靠性技术的必要性包含以下三个方面的含义:

  • 用户如果修改了已建立完成并承载业务的MPLS TE隧道的一些属性(比如带宽),这意味着此隧道要按照修改后的属性参数重新建立路径,并将流量切换到新的路径上,而这一过程就有可能引起流量的丢失。
  • 对于已建立完成并承载业务的MPLS TE隧道而言,如果其路径上某一节点或链路出现了故障,这就要求其能够在备份的路径上重新建立隧道并将流量切换到新的路径上,而这一过程同样会引起流量的丢失。
  • 对于已建立完成并承载业务的MPLS TE隧道而言,如果其路径上某一节点控制层面故障但转发层面并没有故障,这就要求在控制层面进行故障恢复的过程中流量转发不中断。

MPLS TE隧道用来承载的业务都是用户的关键业务,在可靠性方面都有很高的要求,因此MPLS TE提供了如表1所示的可靠性技术。
在这里插入图片描述

Make-Before-Break

保证属性更新前后建立的CR-LSP流量切换中的可靠性
Make-Before-Break机制用来解决隧道属性变更导致的新旧CR-LSP切换过程中的流量丢失问题,可以增强MPLS TE隧道的可靠性。

产生原因

对于一条建立好的MPLS TE隧道而言,当链路属性或隧道属性变化导致有了更优的路径时,原隧道要按照新的属性重新建立CR-LSP,并在建成后将流量切换到新的CR-LSP上。在上述过程中很可能出现新的LSP尚未建立完成时就把流量切换过去而导致流量丢失的问题。MPLS TE提供了Make-Before-Break机制来避免上述问题的发生。

实现过程

Make-Before-Break是一种在原有路径被拆除前先建立新路径(也称为Modify LSP),将流量进行切换的一种机制。它可以在进行流量切换时尽可能不丢失数据和不占用额外带宽的前提下改变MPLS TE隧道属性。Make-Before-Break是通过SE风格实现的。

新路径建立时,可能会与原路径在某些共同链路上竞争带宽资源,这会导致新路径竞争失败而无法建立。通过Make-Before-Break机制,新路径需要预留的带宽不被重复计算,即采用原路径使用的带宽。路径重合的地方不额外占用带宽,路径不重合的地方还是额外占用带宽。
在这里插入图片描述
在图1中,假设所有链路最大可预留带宽为60Mbit/s。新建一条Switch_1到Switch_4的CR-LSP,带宽为40Mbit/s,路径是Path1。

现在希望将路径改为Path2,通过负载较轻的Switch_5进行数据转发。此时Switch_3→Switch_4上剩余的可预留带宽只有20Mbit/s,不足40Mbit/s。这种情况可以通过Make-Before-Break机制来解决,新建立的路径Path2在Switch_3→Switch_4上进行资源预留时采用原路径使用的带宽。新隧道建立成功后,流量转到新路径上后拆除原路径。

与此类似的是增加隧道的带宽,只要共用链路的可预留带宽满足增量要求,新的CR-LSP就可以建立成功。

仍以图1为例,假设所有链路最大可预留带宽为60Mbit/s。新建一条Switch_1到Switch_4的CR-LSP,带宽为30Mbit/s,路径是Path1。

现在希望将路径改为Path2,通过负载较轻的Switch_5进行数据转发,并将带宽增大为40Mbit/s。此时Switch_3→Switch_4上剩余的可预留带宽只有30Mbit/s,不足40Mbit/s。这种情况也可以通过Make-Before-Break机制来解决,新建立的CR-LSP的路径Path2在Switch_3→Switch_4上进行资源预留时采用原路径使用的带宽,并追加增量带宽。新的CR-LSP建立成功后,流量转到新路径上后拆除原路径。

切换延迟和删除延迟

在实际应用中,MPLS网络各节点所承载业务状态都不尽相同,当上游和下游节点的业务繁忙程度相差比较大时,有可能出现原CR-LSP被提前删除,导致流量短暂中断的现象。

为了避免这一问题,Make-Before-Break机制引入了切换延迟时间和删除延迟时间。当新CR-LSP建立成功时,延迟一定的时间再将流量转到新CR-LSP上,并再延迟一定的时间删除原来的CR-LSP。

RSVP Hello(故障检测)

RSVP的Hello扩展机制用于快速检测RSVP节点之间的可达性,通常用来触发TE FRR的路径保护。同时还可以检测邻居节点是否处于重启状态,以支持邻居实现RSVP GR。

产生原因

RSVP Refresh消息除了可以进行节点间状态(包括PSB和RSB)同步之外,另外起到的一个作用就是可以检测各邻居间的可达性,维护RSVP节点之间的邻居关系。

但是这种软状态机制所采用的Path消息和Resv消息检测邻居关系是否可达的速度较慢,在路径出现故障时不能及时触发业务向备份路径切换流量。因此,引入RSVP Hello扩展来解决这个问题。

实现过程

RSVP Hello的实现过程如下:

1.Hello握手机制
在这里插入图片描述
如图1,LSRA、LSRB之间有链路直接相连。

  • 当LSRA接口下使能了RSVP Hello时,LSRA会向LSRB发送Hello Request消息。
  • 若LSRB收到了Hello消息,并且LSRB也使能了RSVP Hello,就会给LSRA节点回复Hello ACK消。
  • LSRA收到LSRB的Hello ACK消息后,就确认LSRA的邻居LSRB是可达的。

2.检测邻居丢失

在LSRA向LSRB发送Hello Request握手成功后,LSRA与LSRB就开始互通Hello消息。当LSRA连续三次向LSRB发送Hello Request消息后,LSRB仍然没有给LSRA回Hello ACK消息,此时就认为LSRB邻居丢失,触发TE FRR切换并重新初始化RSVP Hello。

3.检测邻居重启

当LSRA和LSRB都使能RSVP GR功能时,在LSRA检查到邻居LSRB丢失后,LSRA就等待LSRB发送有GR扩展的Hello Request消息。收到此消息后,LSRA开始协助LSRB恢复RSVP状态,并向LSRB发送Hello ACK消息。LSRB收到LSRA回复的Hello ACK消息后,发现LSRA已开始协助自己进行GR。然后LSRA和LSRB互通Hello消息,维持GR恢复状态。

当LSRA和LSRB同属于一条CR-LSP时:

  • 如果没有使能GR功能,但使能了TE FRR功能,则检测到邻居丢失时,会触发流量切到旁路隧道(Bypass CR-LSP)上,保证流量不中断。
  • 如果使能了GR功能,则优先按照GR方式处理。

适用场景

RSVP Hello适用于TE FRR和RSVP GR的场景中。

CR-LSP备份

CR-LSP备份技术能够为MPLS TE隧道提供端到端的路径保护能力,当入节点感知到主CR-LSP不可用时,会将流量切换到备份路径上。当主CR-LSP路径恢复后再将流量切换回来,以实现对主CR-LSP路径的备份保护。

相关概念

CR-LSP备份有热备份和普通备份两种方式,除了这两种方式之外,为了进一步提高MPLS TE隧道的可靠性,系统还提供了一种逃生路径技术。

  • 热备份(Hot-standby):指创建主CR-LSP后随即创建备份CR-LSP。当主CR-LSP故障时,将业务流量切换至备份CR-LSP。
  • 普通备份:指主CR-LSP故障后创建备份CR-LSP,再将业务流量切换至备份CR-LSP。
  • 逃生路径:指在主、备CR-LSP都故障时,创建一条临时的CR-LSP,将业务流量切换到逃生路径上。
    如图1,主CR-LSP路径为PE1→P1→P2→PE2;备份CR-LSP路径为PE1→P3→PE2。当主备CR-LSP都故障时,PE1触发建立逃生路径PE1→P4→PE2。
    在这里插入图片描述

逃生路径没有带宽保证,可以根据通过配置逃生路径的亲和属性和跳数限制来控制其途经的路径。

实现过程

CR-LSP备份技术的整个实现可以分为如下几个过程:

1.规划

部署CR-LSP备份时的路径规划、带宽规划及部署方式见表1。
在这里插入图片描述
在这里插入图片描述

2.备份CR-LSP创建

同一条隧道下可能存在多种建立备份CR-LSP的方式。在创建CR-LSP时,为了使隧道能够尽可能快速的承载业务,系统会轮流创建每种方式的备份CR-LSP,直到建立成功。

CR-LSP的轮流创建规则如下:

a.当新提交一条隧道或者隧道状态变为Down时,系统将按一定的优先级顺序轮流尝试创建热备份CR-LSP、普通备份CR-LSP、逃生路径,直到隧道建立成功。

b.在创建热备份或者普通备份类型的CR-LSP时,用户可以在这两种CR-LSP下面最多配置三个CR-LSP配置模板,这些配置模板之间存在一定的优先级别,系统会按照优先级别从高到低轮流尝试创建各个配置模板,直到该CR-LSP建立成功。

c.如果使用的是低优先级的CR-LSP配置模板创建隧道成功,当链路状况发生改变时,系统将不断尝试向更高优先级的CR-LSP配置模板升级,即尝试用更高优先级的属性模板来创建备份CR-LSP。在升级过程中,系统将以Make-Before-Break机制创建新的CR-LSP保证流量不会中断。

d.如果备份CR-LSP下的三个属性模板都可以创建出稳定性较好的CR-LSP,则用户可以配置备份CR-LSP属性模板锁定功能。当配置了锁定功能以后,即使当前的备份CR-LSP使用的是一个低优先级属性模板,系统也不会去尝试更高优先级属性模板。这样可以减少很多不必要的流量切换,降低系统开销。

用户可以根据需要进行备份模式的配置,交换机设备目前支持以下方式:

  • 热备份模式(手工配置)
  • 同时配置热备份模式(手工配置)和逃生路径
  • 热备份模式(使用属性模板配置)
  • 同时配置热备份模式(使用属性模板配置)和普通备份模式(使用属性模板配置)
  • 同时配置热备份模式(使用属性模板配置)和逃生路径
  • 同时配置热备份模式(使用属性模板配置)、普通备份模式(使用属性模板配置)和逃生路径
  • 普通备份模式(手工配置)
  • 普通备份模式(使用属性模板配置)
  • 同时配置普通备份模式(使用属性模板配置)和逃生路径
  • 逃生路径

3.备份CR-LSP的属性修改

当用户修改了备份CR-LSP的约束条件时,入节点会触发重建备份CR-LSP。备份CR-LSP重建的过程采用了Make-Before-Break机制。当携带新属性的CR-LSP完全建立成功以后,如果此时备份CR-LSP已经承载了流量,MPLS TE隧道会将流量切换到新的CR-LSP上,然后删除原来的备份CR-LSP。

4.故障检测

CR-LSP备份技术可以采用如下故障检测技术:

  • RSVP-TE的默认错误通告机制,但通常检测速度稍慢。
  • BFD for CR-LSP:可以对故障进行快速检测,推荐采用此种方式。

5.流量正切

当隧道主CR-LSP发生故障后,入节点会触发流量从主CR-LSP向备份CR-LSP切换。其中切换的优先级顺序为热备份优先级最高,其次是普通备份,逃生路径优先级最低。

6.流量回切

在备份CR-LSP承载流量的期间,流量会根据具体情况,按照一定优先级进行路径回切。其中主CR-LSP有最高优先级,其次是热备份CR-LSP,普通备份CR-LSP优先级最低。

CR-LSP热备份dynamic-bandwidth保护机制

热备份CR-LSP可以配置dynamic-bandwidth保护,即动态带宽保护功能。在该功能下,在主CR-LSP出现故障之前,热备份CR-LSP并不会额外占用网络中的带宽资源(带宽值为0),只有当热备份CR-LSP真正承载流量后才会占用网络的带宽资源。这样可以更大幅度的节省网络资源,缩减网络开销。

使能动态带宽保护功能后,主CR-LSP承载流量,而热备份CR-LSP将不占用链路带宽。其具体过程为:

  1. 当主CR-LSP出现故障后,流量立即切换到带宽值为0的热备份CR-LSP,同时MPLS TE隧道入节点立即采用Make-Before-Break机制重建热备份CR-LSP。
  2. 当新的热备份CR-LSP建立成功后,流量就切换到新的CR-LSP上,同时将带宽值为0的热备份CR-LSP删除。
  3. 当主CR-LSP故障恢复后,流量会重新回切到主CR-LSP。此时热备份CR-LSP会释放已占用的带宽,重新采用0带宽建立热备份CR-LSP。

CR-LSP热备份Overlap-path功能

热备份CR-LSP可以配置Overlap-path功能,即在满足热备份CR-LSP的路径与主CR-LSP的路径尽量分离的情况下,支持部分重合,从而保证热备份CR-LSP对主CR-LSP的保护。

TE FRR

TE FRR能为MPLS TE隧道提供链路及节点的保护。当某处链路或节点故障时,流量会快速切换到备份路径,继续转发,从而最大程度上避免流量的丢失。

产生原因

通常情况下,MPLS TE隧道的链路或节点故障会引发隧道由主用路径向备份路径的切换。此切换过程涉及到IGP路由在备份路径的重新收敛、CSPF重新计算路径以及CR-LSP的重新建立,速度较慢,会导致流量的丢失。

TE FRR(Fast ReRoute)技术可以解决此问题。TE FRR会预先建立绕过故障的链路或者节点的旁路隧道,使得MPLS TE隧道链路或节点故障时独立于IGP协议的重收敛,快速切换到旁路隧道,避免流量丢失。在流量从旁路隧道传输的同时,MPLS TE隧道入节点会继续发起主CR-LSP的重建。

相关概念

在这里插入图片描述
针对图1所涉及的TE FRR的相关概念的解释如表1。
在这里插入图片描述
按照不同的分类标准TE FRR可分为以下几种类型,如表2。
在这里插入图片描述
在这里插入图片描述

对于一条已建立的旁路隧道,以上几种保护类型将以组合形式出现,比如:手工保护+节点保护+带宽保护,其他形式可依此类推。

实现过程

TE FRR的整个实现过程包括下面五个步骤:

1.主CR-LSP的建立

主CR-LSP的建立过程与普通CR-LSP的建立过程一致,不同之处主要是:建立主CR-LSP过程中,隧道入节点会在Path消息的SESSION_ATTRIBUTE对象中添加相关标记。比如,局部保护标记用于标识主CR-LSP需要绑定Bypass CR-LSP,带宽保护标记则表示需要进行带宽保护。

2.绑定Bypass CR-LSP

为主CR-LSP寻找合适的Bypass CR-LSP的过程称为绑定。只有具有局部保护标记的主CR-LSP才会触发绑定策略,绑定是在隧道切换之前完成的。

实现绑定前,节点需根据Resv消息的RRO计算出Bypass CR-LSP的出接口、NHLFE、MP的LSR ID、MP分配的标签及保护的类型等信息。

对于主LSP上的PLR节点而言,其下一跳(NHOP)或下下一跳(NNHOP)是已知的。如果Bypass CR-LSP的Egress LSR ID与NHOP的LSR ID相等,就可以形成链路保护;如果Bypass CR-LSP的Egress LSR ID与NNHOP的LSR ID相等,就可形成节点保护。如图3中的Bypass LSP 1和Bypass LSP 2,前者即为链路保护,后者即为节点保护。
在这里插入图片描述

当同一个节点上有多条可用的Bypass CR-LSP时,主隧道将按照是否提供带宽保护→实现方式→保护对象这个顺序来进行旁路隧道的选择。其中,带宽保护优于非带宽保护,手工保护优于自动保护,节点保护优于链路保护。比如图3中的Bypass LSP 1和Bypass LSP 2,如果两者都能够提供带宽保护,且都为手工保护,则主LSP将选择Bypass LSP 2进行绑定。如果Bypass LSP 1能提供带宽保护,而Bypass LSP 2只能提供链路保护,则主LSP将选择Bypass LSP 1进行绑定。

如果旁路隧道绑定成功,主CR-LSP的NHLFE表项中记录Bypass CR-LSP的NHLFE表项索引以及MP为上一个节点分配的标签,即内层标签。内层标签用于FRR切换时的流量转发。

3.故障检测

  • 链路保护直接使用链路层协议实现故障检测和通告,链路层发现故障的速度与链路类型直接相关。
  • 节点保护则使用链路协议检测链路故障,在链路没有故障的情况下,使用RSVP Hello机制或结合BFD for RSVP机制检测被保护节点的故障。

一旦检测到链路故障或节点故障,就会同步触发FRR的流量切换。

4.切换

切换是指主CR-LSP故障后,业务流量和RSVP消息从主CR-LSP切换到Bypass CR-LSP上,并向上游通告切换已经发生的过程。在切换的时候,会采用MPLS的标签嵌套机制,PLR节点会对数据报文先压入内层标签,再压入Bypass CR-LSP的下一节点为其分配的标签作为外层标签,Bypass CR-LSP会在倒数第二跳弹出外层标签,把只带有内层标签的报文传给MP,由于该内层标签原本就是MP分配给上一个节点的,因此MP能继续转发此报文给主CR-LSP的下一跳。

例如,TE FRR切换前已经建立一条主CR-LSP和一条Bypass CR-LSP,其中主CR-LSP上各个节点分配的标签以及转发动作如图4所示。可见这里的Bypass CR-LSP形成了节点保护,如果LSRB和LSRC间的链路故障或者LSRC节点故障,都会触发流量向Bypass路径的切换。切换时,PLR节点LSRB将标签1024交换为MP节点为上一节点分配的标签1022作为内层标签,再压入Bypass CR-LSP的下一节点为PLR分配的标签34作为外层标签进行转发,以保证最终报文到达LSRD时仍能够继续转发给下一跳,具体转发流程请参见图4中的“TE FRR切换后的报文转发”。
在这里插入图片描述

5.回切

切换后主CR-LSP的Ingress节点会试图重建主CR-LSP,并在主CR-LSP重建成功后,将业务流量和RSVP消息从Bypass CR-LSP回切到主CR-LSP上,其中尝试重建的CR-LSP称为Modified CR-LSP。此过程,TE FRR采用Make-Before-Break机制,即只有Modified CR-LSP建立成功后,原来的主CR-LSP才能被删除。

FRR不支持多点故障。如果发生了FRR切换,数据从主CR-LSP切换到Bypass CR-LSP,在数据通过Bypass CR-LSP转发期间,Bypass CR-LSP的状态必须始终保持UP。一旦Bypass CR-LSP在此期间出现故障,被保护的数据将不能通过MPLS转发,从而出现流量中断,FRR功能失效。即使Bypass CR-LSP重新建立,流量也无法转发,只能等待主CR-LSP恢复或重新创建后,流量才恢复转发。

其他功能

N:1保护

TE FRR支持N:1的保护模式,即一条Bypass CR-LSP可以保护多条主CR-LSP。

CR-LSP备份与TE FRR共存

1.CR-LSP备份与TE FRR联合部署

  • CR-LSP普通备份与TE FRR结合使用:TE FRR可以及时响应链路故障,将流量在最短的时间内切换到Bypass CR-LSP上。当主CR-LSP和Bypass CR-LSP都出现故障之后,才会建立备份CR-LSP并将流量切换到备份CR-LSP上。
  • CR-LSP热备份与TE FRR结合使用:TE FRR可以及时响应链路故障,将流量在最短的时间内切换到Bypass CR-LSP上,链路故障信息通过信令带到隧道入节点,然后将流量切换到备份CR-LSP上。

2.CR-LSP备份与TE FRR同步联动

当用户同时部署TE FRR的局部保护和备份CR-LSP的端到端保护之后,系统支持单独配置旁路保护隧道与备份CR-LSP同步联动的功能。当使能了CR-LSP备份同TE-FRR同步联动之后:

  • 如果配置的是普通备份

    当被保护链路或节点出现故障时,流量切换到TE FRR的Bypass CR-LSP并尝试恢复主CR-LSP,同时也会轮流尝试创建备份CR-LSP。

    当备份CR-LSP创建成功,并且主CR-LSP未恢复时,流量会切换到备份CR-LSP。

    当主CR-LSP恢复成功,则不管当前流量是处于Bypass CR-LSP还是备份CR-LSP,流量都会切换到新的主CR-LSP上。

    当备份CR-LSP创建不成功,且主CR-LSP恢复也不成功,流量仍然从Bypass CR-LSP通过。

  • 如果配置的是热备份

    当备份CR-LSP的状态为Up,且被保护链路或节点出现故障时,则流量先切换到Bypass CR-LSP后,立即切换到备份CR-LSP上,同时尝试恢复主CR-LSP。

    当备份CR-LSP的状态为Down,则处理方式与普通备份相同。

    当主CR-LSP处于Up状态的同时,热备份CR-LSP也会一直尝试创建,当创建成功,就会占用额外的带宽。而普通备份CR-LSP在主CR-LSP处于Frr-in-use状态时才开始创建,在主CR-LSP没有出现故障时,不需要占用额外的带宽资源。因此推荐选择普通备份的方式同TE FRR同步联动。

共享风险链路组(流量保护)

共享风险链路组SRLG(Shared Risk Link Group)主要用在CR-LSP热备份或TE FRR组网中作为备份隧道路径计算的限制条件,使得备份路径不与隧道主路径建立在具有同等风险等级的链路上,进一步增强TE隧道的可靠性。

产生原因

网络管理员通常会采用CR-LSP热备份或TE FRR技术来确保MPLS TE隧道的可靠性,但在实际的部署应用中,常会遇到保护失效的问题,下面以TE FRR为例介绍。
在这里插入图片描述

如图1所示,主CR-LSP路径为Path1,其中链路P1→P2需要TE FRR保护,Bypass CR-LSP的路径是Path2。

通常来说骨干网的核心节点(P1、P2、P3)之间都由传送网的设备连接,即图1中上图为组网的抽象拓扑,下图为实际的拓扑,其中NE1为传送网设备,在网络的组建和部署中往往会存在某些核心节点间共享了某段传送网链路的情况,比如图1中P1、P2和P3之间共享了标注为黄色的链路。如果共享的这段链路如果出现故障,会同时影响到主CR-LSP和Bypass CR-LSP,从而导致FRR保护失效。此时需要在建立Bypass CR-LSP时避过这种和主CR-LSP有共同风险的链路,以保证TE FRR能有效保护MPLS TE主隧道。这种技术就是SRLG。

SRLG是具有相同故障风险的一组链路集合,即如果其中一条链路失效,那么组内的其他链路也可能失效。这种情况下使用组内的其他链路作为失效链路的热备份CR-LSP或Bypass CR-LSP,将不能起到保护的作用。

实现过程

SRLG是一种链路属性,用数值表示,数值相同的链路表示属于同一个共享风险链路组。

SRLG是通过IGP TE来发布给整个MPLS TE域即相同域中的节点能够获取域内所有链路的SRLG信息。CSPF计算路径时,不仅会考虑带宽等约束条件,同时将SRLG作为约束条件来计算。

MPLS TE SRLG具有两种操作模式:

  • 严格SRLG模式(strict mode):对热备份CR-LSP和Bypass CR-LSP路径的计算,必须考虑SRLG的约束条件。
  • 首选SRLG模式(preferred mode):对热备份CR-LSP和Bypass
    CR-LSP计算路径时候可以不考虑SRLG的约束条件。如果第一次CSPF考虑SRLG约束计算备份路径失败,那么第二次进行算路的时候将不会考虑SRLG的约束条件。

适用场景

SRLG适用于应用了TE FRR和CR-LSP热备份技术的网络场景。

使用价值

部署SRLG可以约束热备份CR-LSP和Bypass CR-LSP路径的选择,避免了主、备路径建立在具有相同故障风险的链路上。

TE隧道保护组(流量保护)

隧道保护组能够为MPLS TE隧道提供端到端的路径保护能力,在主隧道发生故障时通过备份隧道较快的恢复数据流的传输。

相关概念

如图1,隧道保护组中涉及如下概念:

  • 主隧道(Working tunnel):被保护的隧道。
  • 保护隧道(Protection tunnel):用来保护主隧道的隧道。
  • 保护倒换:在隧道保护组中,当主隧道发生故障时,数据流迅速倒换到备份隧道,从而提高网络可靠性。
    在这里插入图片描述

如图1,在入节点LSRA上指定主隧道tunnel-1的保护隧道为tunnel-3。根据配置的故障检测机制,当在入节点检测到tunnel-1隧道故障之后,则可以将流量切换到保护隧道tunnel-3上。而tunnel-1会一直尝试重建,如果建立成功,流量会根据配置的策略决定是否回切到主隧道上来。

实现过程

TE隧道保护组主要是通过预先的规划来提高主隧道的可靠性,所以在部署TE隧道保护组之前,需要对网络进行规划。为了能让保护隧道起到更好的保护作用,需要让保护隧道尽量不经过主隧道经过的链路和设备。

隧道保护组的具体实现流程,请参见表1。
在这里插入图片描述
1:1保护和N:1保护

隧道保护组支持1:1保护和N:1保护,即一条保护隧道既可以只保护一条隧道也可以保护多条隧道。
在这里插入图片描述
隧道保护组与CR-LSP备份的区别

CR-LSP备份和隧道保护组都是MPLS TE中的端到端的保护机制。这两种保护机制的主要区别请参见表2。
在这里插入图片描述

BFD for MPLS TE

双向转发检测BFD(Bidirectional Forwarding Detection)可以对MPLS TE隧道进行快速故障检测,从而触发TE隧道可靠性功能进行流量切换,提高整网可靠性。

产生原因

MPLS TE经常采用TE FRR、CR-LSP备份或TE隧道保护组来提高网络的可靠性,但是这几种技术依靠RSVP Hello或者RSVP消息刷新超时等机制进行故障检测,检测速度缓慢。当节点间存在二层设备(比如交换机或HUB)时,触发流量保护倒换的速度将变慢,一定程度上引起流量的丢失。BFD检测机制可以很好的解决这个问题,它采用快速收发报文的机制,完成这些隧道链路故障的快速检测,从而引导承载的业务流量进行快速切换,达到保护业务的目的。

相关概念

根据BFD会话的建立方式,BFD可分为动态和静态两种。

  • 静态BFD:通过手工配置BFD的本地标识符和远端标识符。
  • 动态BFD会话:BFD的本地标识符和远端标识符由系统自动分配。

实现过程

MPLS TE中的BFD检测技术的按照检测对象的不同可分为三种:

1、BFD for RSVP

当RSVP相邻节点之间存在二层设备时,这两个节点只能根据Hello机制感知链路故障,故障时间为秒级,这将导致数据大量丢失。

BFD for RSVP使用BFD检测RSVP邻居关系,BFD for RSVP可实现毫秒级故障监测时间,并配合RSVP协议快速的发现RSVP邻接故障。BFD for RSVP一般用在TE FRR中PLR节点与主路径的RSVP邻居之间存在二层设备的情况,如图1。
在这里插入图片描述
BFD for RSVP可以与BFD for OSPF、BFD for ISIS和BFD for BGP共享会话。共享BFD会话时,则本地节点分别选择所有共享BFD会话的协议的发送时间间隔、接收时间间隔、本地检测倍数的最小值作为本地的BFD会话参数。

2、BFD for CR-LSP

BFD for CR-LSP是对CR-LSP的检测,能够快速检测到CR-LSP的故障,并及时通知转发层面,从而保证流量的快速切换。BFD for CR-LSP通常与热备份CR-LSP或者隧道保护组配合使用。

BFD会话与CR-LSP绑定,即在入节点和出节点之间建立BFD会话。BFD报文从源端开始经过CR-LSP转发到达目的端,目的端再对该BFD报文进行回应,通过此方式在源端可以快速检测出CR-LSP所经过链路的状态。

当检测出链路故障以后,BFD将此信息上报给设备转发层面。转发层面查找备份CR-LSP,然后将业务流量切换到备份CR-LSP上。然后设备转发层面再将故障信息上报给控制层面,如果采用的是动态BFD for CR-LSP,控制层面会主动去创建备份CR-LSP的BFD会话。如果采用的是静态BFD for CR-LSP时且需要对备份CR-LSP进行检测,则可以为其配置BFD检测。
在这里插入图片描述
BFD for TE Tunnel

BFD for TE Tunnel使用BFD检测整条TE隧道,从而触发VPN FRR等应用进行流量切换。

BFD for TE Tunnel与BFD for CR-LSP的区别是故障通告的对象不同。BFD for TE Tunnel是向VPN等应用通告故障,触发业务流在不同TE隧道接口上的切换;BFD for CR-LSP是向TE隧道通告故障,触发业务流在同一TE隧道内的不同CR-LSP上的切换。

三者区别

BFD for RSVP、BFD for CR-LSP以及BFD for TE Tunnel三者的区别可以参见表1。
在这里插入图片描述

RSVP GR

RSVP GR(Graceful Restart)可以保证节点故障后控制平面主备倒换时转发平面上的数据传输不会中断。

产生原因

如图1,PE(Provider Edge)路由器是典型的GR应用场所,特别是用户单点接入骨干网的情况。当单点PE出现故障或者出于维护目的(比如升级软件版本)导致PE路由器发生主备倒换,此时如果部署了MPLS TE隧道来实施流量工程或者作为VPN公网隧道,则可以在类似PE3这样的单点接入设备上部署RSVP GR,给用户的关键业务提供不间断转发的高可靠性保障。
在这里插入图片描述

相关概念

RSVP GR是RSVP-TE的一种快速状态恢复机制,属于高可靠性技术的一种,基于NSF(None Stop Forwarding)理念设计。

GR过程中有GR-Restarter和GR-Helper两种角色的路由器,GR-Restarter是指进行协议平滑重启,GR-Helper是指协助协议平滑重启。

RSVP GR主要有下面三种消息类型:

  • 带GR扩展的Hello消息:该消息用于检测邻居的GR状态。
  • GR Path消息:由上游节点发出,该消息携带有最后一次进行Path刷新消息的内容。
  • Recovery Path消息:由下游节点发出,该消息携带有下游节点最后一次收到的Path消息的内容。

实现过程

RSVP GR通过RSVP Hello扩展来检测邻居的GR状态。

RSVP GR的实现机制如下:

如图2,GR-Restarter节点故障重启后,将停止向邻居节点发送Hello消息。使能了GR的邻居节点(GR-Helper)在连续3次未收到Hello消息后,认为邻居在做GR,所有的转发信息都将继续保持。同时设备继续传输业务,并等待GR-Restarter节点进行GR恢复。

在GR-Restarter节点启动后,如果收到邻居的Hello消息,会向邻居节点发送Hello消息,处于隧道上游和下游的节点的处理方式是不一样的:

  • 上游的GR-Helper节点收到该消息后,向GR-Restarter节点(自己的下游)发出GR Path消息。
  • 下游的GR-Helper节点收到该消息后,向GR-Restarter节点(自己的上游)发出Recovery Path消息。
    在这里插入图片描述

当GR-Restarter节点收到GR Path消息和Recovery Path消息时,根据这两个消息重新建立CR-LSP相关的状态信息,这样本地控制层面信息就恢复了。

若下游支持节点不能发送Recovery Path消息,则本地状态仅通过GR Path消息来重建。

适用场景

采用RSVP-TE协议建立MPLS TE隧道承载业务时,可以部署RSVP GR来提高本节点的设备可靠性。

使用价值

保证故障节点控制层面主备倒换时,数据业务转发不间断,为MPLS TE节点提供设备级可靠性。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值