堆叠集群概述
堆叠:将多台支持堆叠特性的交换机通过堆叠线缆连接在一起,从逻辑上虚拟成一台交换设备,作为一个整体参与数据转发。
集群:将两台支持集群特性的交换机设备组合在一起,从逻辑上虚拟成一台交换设备。 集群只支持两台设备,一般高端框式交换机支持CSS、盒式设备支持iStack。
使用堆叠、集群技术将独立的交换机虚拟化成一台逻辑的交换机,一般接入、汇聚层盒式交换机采用堆叠技术,汇聚、核心层交换机采用集群技术。 在逻辑交换机之间使用链路聚合技术,无需部署STP、VRRP实现高可靠性。
堆叠、集群的优势
1.资源利用率高,获得更高的转发性能,链路带宽
2.降低网络架构的复杂度,便于管理
3.可以大大降低业务中断的时间
堆叠概念
堆叠系统中所有的单台交换机都称为成员交换机,按照功能不同,可以分为三种角色:
主交换机:主交换机负责管理整个堆叠。堆叠系统中只有一台主交换机。
备交换机:备交换机是主交换机的备份交换机。堆叠系统中只有一台备交换机。当主交换机故障时,备交换机会接替原主交换机的所有业务。类似bdr
从交换机:从交换机用于业务转发,堆叠系统中可以有多台从交换机。从交换机数量越多,堆叠系统的转发带宽越大。除主交换机和备交换机外,堆叠中其他所有的成员交换机都是从交换机。当备交换机不可用时,从交换机承担备交换机的角色。
堆叠优先级:堆叠优先级是成员交换机的一个属性,主要用于角色选举过程中确定成员交换机的角色,优先级值越大表示优先级越高,优先级越高当选为主交换机的可能性越大。
堆叠ID:即成员交换机的槽位号(Slot ID),用来标识和管理成员交换机,堆叠中所有成员交换机的堆叠ID都是唯一的。
设备堆叠ID缺省为0。堆叠时由堆叠主交换机对设备的堆叠ID进行管理,当堆叠系统有新成员加入时,如果新成员与已有成员堆叠ID冲突,则堆叠主交换机从0~最大的堆叠ID进行遍历,找到第一个空闲的ID分配给该新成员。
堆叠逻辑接口:交换机之间用于建立堆叠的逻辑接口,每个交换机支持两个逻辑接口,分别为stack-port n/1和stack-port n/2,其中n为成员交换机的堆叠ID。
一个逻辑堆叠端口可以绑定多个物理成员端口,用来提高堆叠的可靠性和堆叠带宽。 堆叠成员设备之间,本端设备的逻辑堆叠端口stack-port n/1必须与对端设备的逻辑堆叠端口stack-port m/2相连。
堆叠系统组建过程:
堆叠方式:
堆叠连接拓扑:环形的更加可靠
主交换机选举、备交换机选举、软件、配置同步:
堆叠管理与配置文件:
堆叠成员退出
堆叠成员退出是指成员交换机从堆叠系统中离开。根据退出成员交换机角色的不同,对堆叠系统的影响也有所不同:
当主交换机退出,备份交换机升级为主交换机,重新计算堆叠拓扑并同步到其他成员交换机,指定新的备交换机,之后进入稳定运行状态。
当备交换机退出,主交换机重新指定备交换机,重新计算堆叠拓扑并同步到其他成员交换机,之后进入稳定运行状态。
当从交换机退出,主交换机重新计算堆叠拓扑并同步到其他成员交换机,之后进入稳定运行状态。
堆叠成员加入
堆叠成员加入是指向已经稳定运行的堆叠系统添加一台新的交换机:
将未上电的交换机连线加入堆叠之后再上电启动,新加入的交换机会选举为从交换机,堆叠系统中原有主备从角色不变。 角色选举结束后,主交换机更新堆叠拓扑信息,同步到其他成员交换机上,并向新加入的交换机分配堆叠ID(新加入的交换机没有配置堆叠ID或配置的堆叠ID与原堆叠系统的冲突时)。 新加入的交换机更新堆叠ID,并同步主交换机的配置文件和系统软件,之后进入稳定运行状态。
堆叠合并
堆叠合并是指稳定运行的两个堆叠系统合并成一个新的堆叠系统。 例如:已上电的一台交换机并且配置了堆叠(已形成单机堆叠),通过堆叠线缆与已经在运行的堆叠系统连接。该过程为堆叠合并,与堆叠加入不同。
两个堆叠系统的主交换机通过竞争,选举出一个更优的作为新堆叠系统的主交换机。 竞争成功的主交换机所在的堆叠系统将保持原有主备从角色和配置不变,业务也不会受到影响 而另外一个堆叠系统的所有成员交换机将重新启动,以从交换机的角色加入到新堆叠系统,其堆叠ID将由新主交换机重新分配,并将同步新主交换机的配置文件和系统软件,该堆叠系统的原有业务也将中断。
堆叠分裂
堆叠分裂是指稳定运行的堆叠系统中带电移出部分成员交换机,或者堆叠线缆多点故障导致一个堆叠系统变成多个堆叠系统。
由于堆叠系统中所有成员交换机都使用同一个IP地址(VLANIF接口地址)和MAC地址(堆叠系统MAC),一个堆叠系统分裂后,可能产生多个具有相同IP地址和MAC地址的堆叠系统,从而引起网络故障,为此必须进行IP地址和MAC地址的冲突检查。
堆叠系统作为一台设备与网络中其他设备通信,具有唯一的MAC地址,称为堆叠系统MAC地址。通常情况下使用主交换机的MAC地址作为堆叠系统MAC地址。 当堆叠系统的MAC地址是主交换机的MAC地址,主交换机故障或者离开堆叠系统,在默认情况下堆叠系统MAC地址会延时10分钟切换,即在10分钟内两个分裂的堆叠系统的MAC相同。
MAD检测
多主检测MAD(Multi-Active Detection):一种检测和处理堆叠分裂的协议,链路故障导致堆叠系统分裂后,MAD可以实现堆叠分裂的检测、冲突处理和故障恢复,降低堆叠分裂对业务的影响。 MAD检测方式有两种:直连检测方式和代理检测方式。在同一个堆叠系统中,两种检测方式互斥,不可以同时配置。
分裂后的堆叠系统通过MAD检测线缆(普通线缆,手动配置为MAD检测链路)发送MAD检测报文进行竞选,竞选失败的堆叠系统会关闭所有的物理端口(手动配置的保留端口除外)以保证不会因IP、MAC冲突对业务产生影响。
MAD检测 - 直连检测
直连检测方式是指堆叠成员交换机间通过普通线缆直连的专用链路进行多主检测。在直连检测方式中,堆叠系统正常运行时,不发送MAD报文;堆叠系统分裂后,分裂后的两台交换机以1秒为周期通过检测链路发送MAD报文进行多主冲突处理。
MAD检测 - 代理检测
代理检测方式是在堆叠系统Eth-Trunk上启用代理检测,在代理设备上启用MAD检测功能。此种检测方式要求堆叠系统中的所有成员交换机都与代理设备连接,并将这些链路加入同一个Eth-Trunk内。与直连检测方式相比,代理检测方式无需占用额外的接口,Eth-Trunk接口可同时运行MAD代理检测和其他业务。
在代理检测方式中,堆叠系统正常运行时,堆叠成员交换机以30s为周期通过检测链路发送MAD报文。堆叠成员交换机对在正常工作状态下收到的MAD报文不做任何处理;堆叠分裂后,分裂后的两个堆叠系统以1s为周期通过检测链路发送MAD报文进行多主冲突处理。
MAD冲突处理:
堆叠分裂后,MAD冲突处理机制使用MAD报文进行MAD竞争,竞争结果为堆叠系统处于Detect状态或者Recovery状态:
Detect:竞争成功,堆叠系统将处于正常工作状态。
Recovery:竞争失败,堆叠系统将状态处于禁用状态,关闭除手动配置的保留端口以外的其它所有物理端口。
堆叠主备倒换
如果堆叠系统当前的主交换机不是用户期望的,此时可以通过配置主备倒换实现将堆叠备交换机升为堆叠主交换机。 除了用户通过命令执行的主备倒换之外,主交换机故障重启也会引起主备倒换。
M-LAG
概念:就是跨设备链路聚合组,是一种实现跨设备链路聚合的机制。
将两台接入交换机以同一个状态和被接入的设备进行链路聚合协商,从而把链路可靠性从单板级别提升到设备级别,组成双活系统。
在M-LAG系统中,ServerA、DeviceA和DeviceB进行跨设备链路聚合。DeviceA和DeviceB通过动态交换服务组DFS Group(Dynamic Fabric Service Group)完成M-LAG设备之间的配对,当DeviceA和DeviceB配对成功后会协商出主备关系。在M-LAG正常工作后,DeviceA和DeviceB之间通过peer-link链路实时同步对端信息。而M-LAG的故障检测则主要依赖于双主检测链路(DAD link,Dual-Active Detection link),设备通过双主检测链路定期互发心跳报文。
MLAG和堆叠的区别:
核心区别:
1.配置复杂度:M-LAG配置相当复杂,每个交换机需要单独配置,堆叠的可以配置一个,其他会自动同步
2.堆叠的控制平面、转发平面、管理、配置都只有一个,而mlag都是独立的。就导致堆叠转发表中能看到另一台设备信息,mlag设备只能看到本设备的接口信息。
3.对于资源而言,堆叠是共用了一个设备的系统资源,如ARP,而MLAG是各自独立的,不同交换机维护各自独立的配置和IP地址。
其他区别:
升级方式:MLAG是独立升级,可将业务中断时间缩短,甚至无感知;堆叠没办法独立升级,只有优化后的快速升级能缩短升级时间,但业务有明显感知。
设备支持数量:MLAG两台、CSS两台、iStack两台以上。
双主检测:MLAG是两台设备都发送心跳,出现双主时会立刻执行err down接口;堆叠是主设备发送心跳报文,出现双主后会竞争才能执行处理。
Eth-Trunk口数量:堆叠是一台设备的最大支持的Eth-trunk成员接口数量,mlag是两台设备最大支持eth-trunk成员口的数量和。
集群
集群交换机系统CSS(Cluster Switch System),又称为集群,是指将两台支持集群特性的交换机设备组合在一起,从逻辑上虚拟成一台交换设备。
CSS与iStack的区别在于,一般框式交换机堆叠称为CSS,盒式交换机称为堆叠,堆叠与集群两者只是叫法和实现有些差异,但是功能是一样的。层数不同
集群中的单台交换机称为集群成员交换机,按照功能不同,可以分为两种角色:
主交换机(Master):主交换机,即Master,负责管理整个集群。
备交换机(Standby):备交换机,即Standby,是主交换机的备份交换机。
集群ID:即CSS ID,用来标识成员交换机,集群中成员交换机的集群ID是唯一的。
CSS Link:集群链路,专门用于组建集群,实现主交换机和备交换机之间数据通信。 集群优先级:即CSS Priority,主要用于角色选举过程中确定成员交换机的角色。优先级值越大优先级越高。