一、什么是集群?
集群就是将两台设备通过堆叠线缆连接,组成逻辑上的一台设备。
二、为什么需要集群?
2.1、提升网络可靠性
集群中的两台交换机分为主备。在主设备故障时,备设备可以顶替主设备的角色,完成数据转发,从设备层面提高了网络的可靠性。同时可以提供跨设备的链路聚合,提升了链路的可靠性。
2.2、简化组网
将两台设备虚拟成一台设备,不再需要vrrtp+mstp等协议,使网络的配置和管理更加简单。
2.3、提高带宽
在需要提高带宽的场景中,可以使新设备与旧设备组成集群,将多条物理链路聚合,提升上行带宽。
2.4、长距离集群
集群支持距离较远的设备组成集群。如下图所示,一楼和二楼的汇聚组成集群,提升可靠性的同时也使网络结构和管理更加简单。
三、如何实现?
3.1、主要概念介绍:
集群域:类似于OSPF中的area,只有集群域相同的两台设备才能建立集群。
集群成员ID:只有1和2,且必须一个为1,一个为2。两台设备的ID相同时无法组成集群。
集群优先级:用于进行主备选举。值越大优先级越高。
3.2、连接方式:注意堆叠口和物理口的区分,以及必须交叉连接。如下图
3.3、建立
建立的过程: 1.集群信息收集 2.主备选举 3.软件版本同步 4.配置文件同步
阶段一:集群信息的收集。主要是互相手机对端设备的设备类型、单板槽位信息、集群ID以及集群优先级。 华为默认的收集时间是180s。
阶段二:主备选举。结束收集新的状态的设备进入主备选举阶段。也就是说启动早的设备会有限进入二阶段,因为一阶段的时间都是180s。选举规则如下:
a.运行状态比较。若是本段设备未收到对端设备的信息,则自动当选为主。后进入的设备只能为备。如果信息正常手机,则进入b阶段。
b.集群优先级比较。优先级越大的成为主设备。
c.系统MAC地址比较系统MAC地址小的设备成为主设备。
d.集群ID比较。集群ID小的设备成为主设备。
阶段三: 软件版本同步。软件不需要相同,兼容即可。若不兼容,以主设备软件为系统软件,同步给被设备。
阶段四:配置文件同步。 主设备配置文件生效,备设备同步主设备配置文件。当发生配置变动时,主设备自动同步给备设备。
3.4、分裂与双主检测
集群的分裂:当主设备主控板10S没有检测到备用主板的心跳,集群就会分裂成两个单框集群,两台设备的配置完全相同。
如果两台设备都正常运行,则在组网中会出现两台IP和MAC完全相同的设备,引起网络故障。为了避免这种情况的出现需要一种检测机制。
双主检测:双主检测是一种检测和处理集群分裂的协议。可以实现集群分裂检测、冲突处理和故障恢复,降低集群分裂对业务的影响。主要有两种方式:
a.直连检测方式:分为通过中间设备直连和直接直连,见下图:
双主检测在接口配置,配置双主检测的接口不能配置其他业务。检测接口会定时1s发送DAD检测报文。正常运行时,不对该报文进行处理;分裂后,通过DAD报文进行双主冲突处理。
b.代理检测方式:与直连检测相比,代理检测使用的不是专用检测接口,而是使用链路中已经存在的Eth-Trunk接口。
DAD冲突处理:当检测到分裂时,会进行优先级比较。优先级高的设备正常工作,优先级低的设备除保留端口和集群端口外,所有物理端口都被关闭。例外:如果双主检测配置了备份IP,则管理网口也不会关闭。
DAD故障恢复:链路恢复后,双主检测状态由Conflict变为Normal。优先级较低的设备会重启,并恢复被关闭的业务端口。
注:图源大部分来自华为的产品文档,如有侵权,请联系我删除。