本发明涉及通信领域,具体地,涉及MLAG接口故障下的主从设备切换方法及系统。
背景技术:
MLAG(Multi-Chassis Link Aggregation Group)技术是一种跨设备的链路聚合技术,将两台物理设备在聚合层面虚拟成一台设备来实现跨设备链路聚合,从而提供设备级冗余保护和流量负载。
如图1所示,用户侧设备CE(可以是交换机或服务器)通过MLAG机制与另外两台设备(SwitchA和SwitchB)进行跨设备链路聚合,共同组成一个M-LAG双主系统。这样可以实现SwitchA和SwitchB共同进行流量的转发,保证网络的可靠性。MLAG双主系统存在四种类型的接口,分别是:Peer-link接口、MLAG成员接口、MLAG上行接口和Keepalive接口。
Peer-link接口是连接SwitchA和SwitchB设备的内部控制的接口,且每台设备上只能存在一个Peer-link接口,通过Peer-link接口创建的链路称之为Peer-link链路,此链路用于交互设备间的协商报文及承载部分转发数据流量。同时为了增强peer-link链路的可靠性和稳定性,推荐采用多条链路做链路聚合。
MLAG成员接口是SwitchA或SwitchB设备连接用户侧CE设备(服务器或交换设备)的汇聚接口。MLAG成员接口与CE设备采用二层汇聚接口进行连接,同时SwitchA和SwitchB设备与用户侧CE设备相同聚合组连接的MLAG成员接口属于一组分布式汇聚组。此分布式汇聚组接口用于承担Switch设备与用户侧CE设备间流量的负载均衡,同时也提高了Switch设备与用户侧CE设备间通信的可靠性。
MLAG上行接口是SwitchA或SwitchB设备连接NetWork网络侧设备的接口。此接口主要承担Switch设备与NetWork网络侧设备间流量的负载均衡,同时也提高了Switch设备与NetWork网络侧设备间通信的可靠性。
Keepalive接口是用于SwitchA和SwitchB设备之间双主检测的接口,Switch设备间双主检测的链路称之为双主检测链路,此链路是一条三层互通链路,用于M-LAG主从设备间发送双主检测报文。Keepalive链路建议采用单独配置一条三层可达的链路来作为双主检测链路(比如:设备管理接口),避免因为Peer-link接口故障导致Keepalive链路不可用问题。
如图2所示,MLAG双主系统主从设备通过Keepalive链路交互的协议报文格式,协议格式内容:消息类型、协议报文序列号、系统优先级、上行接口状态、MLAG成员接口UP数和Peer-link接口状态。Switch设备根据接收到对端Switch设备设备的MLAG接口状态数据,与本地设备的MLAG接口状态进行比较,选择出Primary主设备和Secondary从设备。
主从设备选举规则:
若本地设备与对端Switch设备设备的上行接口状态、MLAG成员接口UP数和Peer-link接口状态均一致时,采用设备系统优先级作为判断条件,系统优先级高的设备为主设备,系统优先级低的设备为从设备。
若本地设备与对端Switch设备设备的上行接口状态不一致,MLAG成员接口UP数和Peer-link接口状态均一致时,采用设备上行接口状态作为判断条件,上行接口状态UP的设备选举为主设备,上行接口状态DOWN的设备选举为从设备。
若本地设备与对端Switch设备设备的MLAG成员接口UP数不一致,上行接口状态和Peer-link接口状态均一致时,采用设备MLAG成员接口UP数作为判断条件,MLAG成员接口UP数大为主设备,MLAG成员接口UP数小为从设备。
按照上述选举规则,MLAG双主系统会选举出主从设备。Peer-link接口为UP状态且未发生故障时,选举出的从设备,不会对MLAG相关接口做处理,仅仅选举出主从设备即可。Peer-link接口发生故障时,选举出的从设备会对除管理接口、peer-link接口和堆叠口以外的接口执行Error-Down操作。
附图3,Peer-link接口故障,触发MLAG双主设备进行Keepalive协议报文交互,同时进行主从设备选举,选举规则如上描述。此时将选举出的从设备上除管理接口、peer-link接口和堆叠口以外的接口执行Error-Down操作,即从设备的MLAG成员接口和上行接口执行Error-Down,保证数据流量转发的正确性。
上述Peer-link接口故障情况下,选举出新的主从设备,可以保证新选举的主设备进行正常数据转发,保证用户侧CE设备与网络侧network设备通信正常。但是此方案存在以下问题:
1、如果新选举主设备上行接口故障,那么MLAG系统的数据转发将会出现异常,系统将无法保证用户侧CE设备与网络侧network设备通信正常;
2、如果新选举主设备LAG成员接口故障,那么MLAG系统的数据转发能力将受到影响,网络侧Network设备与用户侧CE设备的通信带宽和