背景:由于生成树协议故障收敛速度较慢,对于高可靠性要求较高企业来说,需求无法得到满足,并且生成树阻塞的接口无法进行转发流量(MSTP协议阻塞接口无法转发对应vlan的流量)
堆叠或集群的技术原理:
通过堆叠线缆将两台或者两台以上设备逻辑成为一台设备,集群最多支持两台设备
堆叠可以将多台盒式交换机堆叠成为一台设备,不同物理设备在逻辑设备上为不同的板卡
集群最多只能将两台框式交换机集群成为一台设备,
堆叠和集群的优势:
1、组网结构简单,通过堆叠或者集群技术将多台交换机逻辑成为一台交换机后,逻辑拓扑中只会存在一台设备
2、管理方便,堆叠或者集群后。管理员只需要对逻辑设备进行管理,在堆叠或者集群的任意设备都可以统一管理整个堆叠或者集群
3、资源利用率得到提升,通过将交换机进行堆叠或者集群后,配合链路聚合技术,可以使得所有链路都参与数据的转发
4、故障收敛,链路出现故障后,原来采用的负载分担故障后,将所有的流量全部转移到剩余的链路上进行转发
堆叠的基本概念:
堆叠的角色:
成员交换机:所有参与堆叠的交换机都是堆叠系统的成员交换机,所有的成员交换机都需要进行业务流量的转发工作
主交换机:在堆叠交换机中选举,有且只有一台,负责整个堆叠系统的管理工作
备交换机:在堆叠交换机中选举,有且只有一台,是主交换机的备份,当主交换出现故障时,接替主交换机的所有工作
从交换机:整个堆叠系统中除了主、备交换机的所有交换机都称之为从交换机
堆叠优先级:
是堆叠系统中交换机的属性,用于选举主从交换使用,越大越优,最大优先级的交换机不一定会成为主交换机,类似于OSPF中的DR设备,不允许进行抢占
堆叠ID:
参与堆叠的交换都会存在一个堆叠ID,默认为0,在同一个堆叠系统中,堆叠ID不允许冲突,当堆叠ID冲突时,由主交换从0-----最大值进行遍历,找到一个空闲的堆叠ID分配给冲突的交换机进行使用
当堆叠成功后,堆叠ID将会成为交换机的板卡号,原有的接口ID将转换为堆叠ID加接口ID
例如:原端口ID为G 0/0/1口,交换机的堆叠ID是3,则新的端口ID为G 3/0/1
堆叠逻辑接口:
参与堆叠的交换机最多只允许有两个,每一逻辑接口可以有一个或者多个物理接口进行逻辑捆绑
交换机的堆叠接口为stack-port N/1和stack-port N/2,其中N为堆叠ID
其作用有两点:
1、如果后续流量需要通过堆叠链路转发,需要堆叠链路的带宽较大
2、提升可靠性,一条堆叠的物理链路出现故障不会导致堆叠系统的分裂
堆叠系统建立过程:理想状态下顺序
1、将所有需要参与堆叠的交换通过堆叠线缆进行相连
2、配置交换机的堆叠配置,理想状态下先配置主交换机的配置,再是备,最后是从交换机
3、堆叠系统会自动选举出主交换机(通过选举规则进行选举)
4、主交换机负责收集整个堆叠系统的拓扑信息,通过拓扑信息选举出备交换机
5、主设备将自己的MAC地址、系统版本、系统补丁等等信息全部同步到整个堆叠系统成员交换机上
注:现实生活中,建议先配置交换机堆叠配置,再将堆叠线缆进行相连
堆叠方式:
1、通过堆叠卡进行堆叠:需要交换机自带堆叠卡或者交换机有空板卡,通过专用的堆叠线进行堆叠,不会占用业务接口
2、通过业务接口进行堆叠:直接使用普通的业务口,通过普通的双绞线进行堆叠,成本相对较低,但是占用业务接口,建议量力而行
堆叠的连接方式:
1、通过链型连接:有头有尾,适合堆叠成员交换机相对较远的位置,不适合进行走线,相对于环形组网的可靠性较低
2、通过环形连接:头尾相连,适合堆叠成员交换机相对较近的位置,相对于链型组网的可靠性较高,如果某个位置的堆叠链路故障,则直接变为链路组网
堆叠的工作过程:
1、将配置完成后,连接线缆
2、在所有的交换机上选举一个主交换机,
通过比较优先级,优先级以大为优,优先级相同则比较MAC地址。以小为优
并不是每一台堆叠交换机都能够参与选举主交换机角色,只有在开启后20S内发送了报文的交换机才能进行参与选举,20S后,主交换机确定,再新增交换只能通过从交换机的角色加入
3、主交换机收集所有成员交换机的拓扑信息等,
通过比较拓扑信息选举备交换机,备交换机比较优先级以大为优,优先级相同比较MAC地址以小为优
4、主交换机将所有的配置文件、系统版本等等配置同步给所有的成员交换机
注:所有的从交换机只能去读取主交换机的配置文件,没有将配置保存在本地,只有备交换机才能将配置文件保存在本地,当主交换机出现故障,备交换机升级成为主交换机,所有的从交换读取新的主交换机配置文件。
堆叠成员退出:
1、主交换机退出堆叠系统:当主交换机退出堆叠系统后,备交换机将成为主交换机,再由新主交换机从所有的从交换机中选举出新的备交换机,给所有的成员交换机同步拓扑信息
2、备交换机退出堆叠系统:当备交换机退出堆叠系统后,主交换机根据拓扑信息重新选举出备份交换机,将拓扑信息重新进行同步
3、当从交换机退出堆叠系统:当从交换机退出堆叠系统后,主交换机重新将拓扑信息同步给所有的成员交换机
堆叠成员加入:
当堆叠系统加入新的交换机,则新交换机以从设备的身份进行加入,此时主交换机重新将拓扑信息同步给所有的成员交换机
堆叠合并:
两个堆叠系统合并成为一个堆叠系统,此时通过比较两个堆叠系统中主交换机的优先级和MAC地址确定合并后的堆叠系统主备,失败的一方会带着原堆叠系统的所有成员交换机进行重启,并且加载新主交换的配置文件等等
堆叠分裂:
1、主备交换机分裂后处于同一堆叠系统中:
此时分裂后的两个堆叠系统,主备所在的堆叠系统不需要进行选举主备,只需要主交换机重新将拓扑信息同步给所有的新堆叠系统成员交换机
原主备不在的堆叠系统需要在所有的交换机中选举新的主备交换机,选举完成后,由主交换机将拓扑信息等同步给所有的成员交换机
2、主备交换机分裂后处于不同的堆叠系统
此时主交换机所在的堆叠系统将重新选举备交换机,并选举完成后由主交换机将拓扑信息同步给所有的成员交换机
原备交换机所在的堆叠系统,备交换机将成为主交换机,并且收集拓扑信息,重新选举新的备交换机并且将拓扑信息同步给新的堆叠系统中的所有成员交换机
堆叠检测:
直连检测:通过堆叠系统自己的成员交换进行检测,需要成员交换机之间使用检测线,如果出现堆叠分裂,则成员交换机之间发送MAD检测报文,成员交换机之间互相处理
代理检测:通过堆叠系统外的设备进行堆叠分裂检测,此时处理MAD报文的对象为第三方设备,由第三方设备判断堆叠系统是否出现分裂,并且堆叠系统与代理检测设备之间的线缆可以进行业务传递。
MAD冲突检测:
当堆叠系统分裂后,互相发送MAD报文,用于检测正常工作的堆叠系统
检测原则:
1、先查看启动时间,分裂后堆叠系统恢复正常转发的时间,如果一个堆叠系统正常后,20S内另外的堆叠系统没有恢复,则认为正常的堆叠系统为主堆叠系统,正常参与转发,未在20S没恢复的堆叠系统认为竞选失败,将自己所有的业务转发口进行关闭,出手工保留的接口外
2、如果分裂的堆叠系统都在20S内完成恢复,则通过比较堆叠系统中的主交换机优先级比较,如果主交换的优先级相同,则比较主交换机的MAC地址,以小为优,竞选成功的主设备所在的堆叠系统将正常转发业务数据,竞选失败的堆叠系统将所有的业务转发口进行关闭,出手工保留的接口外
主备倒换:
1、由于堆叠系统中主交换机设备故障恢复会导致设备主备进行倒换
2、如果堆叠系统中主备角色与设置的不一致,可以通过命令将主备进行倒换,但是,通过命令的方式进行的主备倒换只会讲主备倒换,不会影响到其他的从交换机
堆叠系统的升级:
1、智能升级:当有新设备加入堆叠系统时,将会自动加载主设备的配置文件的信息
2、传统升级:需要对堆叠系统进行整体升级时
需要在所有的设备上进行升级,升级完成后,将所有的设备进行重启,重启后升级的版本生效
3、平滑升级:
将整个堆叠系统划分为主区域和备份区域,先使用主区域进行业务承载,将备区域的所有设备进行升级,升级完成后,由备区域承载业务,将主区域的设备进行升级,当主区域的所有设备升级完成后,重新加入到堆叠系统,此时,主区域的所有交换机都将变成从交换机,备区域的主交换机为整个堆叠系统的主交换机
跨设备链路聚合:
1、由于堆叠交换机的成员为堆叠系统的接口板卡
2、此时可以通过将不同的板卡接口加入同一聚合口,实现跨设备的链路聚合
流量本地优先转发:
1、交换机之间的堆叠链路带宽有限,为了防止所有流量经过堆叠链路进行转发,导致堆叠链路拥塞,进而导致堆叠分裂
2、使能流量本地优先转发,成员交换机收到业务流量后,能够直接转发出堆叠系统到达目的的流量直接转发出去
3、对于需要跨堆叠设备进行转发的流量,采用尽可能穿越少的堆叠链路
集群的概念:
集群中的单台交换机称为集群成员交换机,按照功能不同,可以分为两种角色:
主交换机(Master):主交换机,即Master,负责管理整个集群。
备交换机(Standby):备交换机,即Standby,是主交换机的备份交换机。
集群ID:即CSS ID,用来标识成员交换机,集群中成员交换机的集群ID是唯一的。
CSS Link:集群链路,专门用于组建集群,实现主交换机和备交换机之间数据通信。
集群优先级:即CSS Priority,主要用于角色选举过程中确定成员交换机的角色。优先级值越大优先级越高
两台交换机使用集群线缆连接好,分别使能集群功能并完成配置后重启,集群系统会自动建立。
集群系统建立后,在控制平面上,主交换机的主用主控板成为集群系统的控制平面,作为整个系统的管理主角色。
备交换机的主用主控板成为集群系统的备用控制平面,作为系统的管理备角色。主交换机和备交换机的备用主控板作为集群系统候选备用主控板。
两台交换机使用集群线缆连接好,分别使能集群功能并完成配置后重启,集群系统会自动建立。
集群系统建立后,在控制平面上,主交换机的主用主控板成为集群系统的控制平面,作为整个系统的管理主角色。备交换机的主用主控板成为集群系统的备用控制平面,作为系统的管理备角色。主交换机和备交换机的备用主控板作为集群系统候选备用主控板。
传统CSS和CSS2代的区别:
1、传统的CSS需要通过主控板或者业务板进行集群操作,CSS2通过交换网板进行集群操作
2、传统的CSS流量需要跨板卡或者设备时,都需要经过主控板进行转发操作,CSS2所有的流量都不经过主控板,跨板卡或者设备的流量都通过交换网板进行转发操作