M-LAG技术原理、应用场景、技术优势。
简介:
M-LAG:就是跨设备链路聚合组,是一种实现跨设备链路聚合的机制。
将两台接入交换机以同一个状态和被接入的设备进行链路聚合协商,从而把链路可靠性从单板级别提升到设备级别,组成双活系统。
名词解释
DFS group:动态交换服务组,用于MLAG之间配对,用于进行MLAG双归设备之间的接口状态,表项等进行同步。
peer-link:是一条直连必须聚合的链路,用于交换协商报文及传输部分流量。
技术原理:
MLAG建立过程(如图)
- DFS Group配对:当两台MLAG设备配置完成后,设备先通过peer-link链路发送DFS group的hello报文。对端收到报文后会-判断报文中携带的DFS group编号是否和本端相同,如果两台设备的DFS group编号相同,则两台设备DFS group配对成功。
- DFS Group主备协商:配对成功后,两台设备会向对端发送DFS group的设备信息报文,设备根据报文中携带的DFS group优先级以及系统MAC地址确认DFS group的主备状态。DFS group优先级高的会成为DFS主设备,如果DFSgroup优先级相同,系统MAC地址小的设备将成为DFS主设备。
- M-LAG成员接口主备协商:DFS group主备状态协商完成后,MLAG两台设备会通过peer-link链路发送MLAG设备信息报文,报文携带MLAG成员接口信息,成员接口同步完成后,确定MLAG成员接口的主备状态。与对端同步端口信息时,状态由down先变成up的成员接口先变成主M-LAG成员口,对端MLAG成员口为备。
- 双主检测:协商出MLAG主备后,两台设备会通过双主检测链路按照1s的周期发送MLAG双主检测报文,一旦设备感知到peerlink故障,会按照100ms周期发送三个双 加速检测。当两台设备设备均能收到对端发送的报文时,双活系统正常工作。华为推荐双主检测链路通过管理网口互通,DFS Group绑定的管理网口IP地址要保证可以相互通信。
- M-LAG同步信息:正常工作后,两台设备会通过peer-link链路发送MLAG同步报文进行实时同步对端信息,MLAG同步报文包括MAC表项、ARP表项以及STP、VRRP协议报文等信息,同时也发送MLAG 成员端口的状态,这样任意一台出现故障,都不影响流量转发。
STP部署方式及对比:
- 基于根桥方式配置MLAG:这种方式是通过将MLAG主设备和MLAG备设备均作为STP网络中的根桥且配置相同的桥mac地址,将两台设备模拟成同一个根桥,使得MLAG主备设备在二层网络中不受其他组网变化的影响。根桥方式,支持STP/RSTP/MSTP,适用于单级MGAG场景
- 基于V-STP方式配置MLAG:这种方式是利用V-STP机制将MLAG主设备和备设备的STP协议虚拟成一台设备的STP协议,对外呈现为一台设备进行STP协议计算。V-STP方式,支持STP/RSTP,适用于MLAG级联场景。
MLAG防环机制(单向隔离机制)
单播流量:从接入设备或者网络侧到达MLAG设备的单播流量,会优先从本地转发出去,peer link不用来转发数据流量。
广播流量:广播流量会通过peerlink到对端MLAG设备,有单向隔离机制来进行防环,保证了从peer-link口进来的流量不会再从M-LAG接口转发出去。
VXLAN网络单波流量
单播流量:从网络侧发送双活端口的单播端口,流量会采用同一VTEP进行封装,流量会负载分担到mlag设备,然后发往双活接入的设备。
VXLAN BUM流量:从网络侧发往双活端口的BUM流量,流量会采用同一VTEP进行封装,流量会负载分担到mlag设备,设备1会对报文进行解封装,之后发送给每一个用户侧端口,由于peer-link与备份接口形成隔离,到达设备2的流量不会转发分双规服务器,避免了环路。
MLAG配置一致性检查
由于MLAG的特性,两台MLAG设备都有独立的控制层面、转发层面,就导致MLAG两端设备某些配置需要保持一致,避免MLAG无法正常工作或环路等问题。
配置一致性检查就是通过配置一致性检查功能,去订阅MLAG两端设备的各个模块配置,通过检查功能返回的对比结果,及时调整两端设备的配置,防止成环及数据包丢失等问题发生。
MLAG配置一致性检查将设备配置分为两类:关键配置(type 1)和一般配置(type 2)。
根据对关键配置检查不一致时,MLAG处理方式分为严格模式和松散模式。
关键配置(type1)出现不一致时:会导致成环,状态正常长时间丢包等问题
严格模式下,会导致MLAG备设备上成员接口处于ERR DOWN状态,触发对Type 1类型配置检查不一致的警告。
松散模式下,会触发设备对两种类型配置检查不一致的警告。
一般配置(type2)出现不一致时:会导致MLAG状态运行异常。与type1而言,type2配置问题更容易发现且对组网环境影响比较小。在严格模式和宽松模式下,都会触发设备对两种类型配置检查不一致的警告。
type1类型的配置:
- 全局下的STP使能、STP模式、BPDU保护使能,MSTP与VLAN映射。
- MLAG成员接口下的STP使能、STP根防护、LACP模式。
type2类型的配置: - 全局下的VLAN配置、静态MAC地址表项、动态ARP老化时间、动态MAC地址老化时间、BD配置、BDIF配置、VLANIF配置
- MLAG成员接口下的STP优先级、VLAN配置、MLAG成员参数配置、MLAG成员口所属Eth-Trunk接口成员口数。
技术优势:
可靠性:把链路可靠性从单板级提高到了设备级。
简化组网:MLAG相当于虚拟化技术,将双归接入的两台设备在逻辑上虚拟成一台设备。MLAG提供了无环的二层拓扑同时实现冗余备份,不需要使用生成树协议,简化了组网。
设备升级:两台设备独立运行,可以分别进行升级,保证一台设备正常工作,对运行的业务几乎没有影响。
MLAG和堆叠的区别:
核心区别:
- 堆叠的控制平面、转发平面、管理、配置都只有一个,而mlag都是独立的。就导致堆叠转发表中能看到另一台设备信息,mlag设备只能看到本设备的接口信息。
- 对于资源而言,堆叠是共用了一个设备的系统资源,如ARP,而MLAG是各自独立的。
其他区别: - 升级方式:MLAG是独立升级,可将业务中断时间缩短,甚至无感知;堆叠没办法独立升级,只有优化后的快速升级能缩短升级时间,但业务有明显感知。
- 设备支持数量:MLAG两台、CSS两台、iStack两台以上。
- 双主检测:MLAG是两台设备都发送心跳,出现双主时会立刻执行err down接口;堆叠是主设备发送心跳报文,出现双主后会竞争才能执行处理。
- Eth-Trunk口数量:堆叠是一台设备的最大支持的Eth-trunk成员接口数量,mlag是两台设备最大支持eth-trunk成员口的数量和。
堆叠本地优先转发和mlag本地优先转发区别
从现象来看两个都是从跨设备eth-trunk口,优先从本地成员接口发出。
区别在于:
堆叠本地优先转发是可以通过命令开启的,默认开启。mlag本地优先转发是没命令控制的。
对于都到BUM帧,堆叠是通过eth-trunk口的hash选择哪个成员接口转发,mlag是本地优先转发。