集群简介
集群交换机系统CSS(Cluster Switch System),又称为集群,是指将两台支持集群特性的交换机设备组合在一起,从逻辑上组合成一台交换设备。通过交换机集群,可以实现网络高可靠性和网络大数据量转发,同时简化网络管理。
-
高可靠性:集群系统两台成员交换机之间冗余备份,同时利用链路聚合功能实现跨设备的链路冗余备份。
-
强大的网络扩展能力:通过组建集群增加交换机,从而轻松的扩展端口数、带宽和业务处理能力。
-
简化配置和管理:集群建立后,两台物理设备虚拟成为一台设备,用户只需登录一台成员交换机即可对集群系统所有成员交换机进行统一配置和管理。
业务口集群方式是指集群成员交换机之间通过业务板上的普通业务口连接,不需要专用的集群卡。业务口集群涉及两种端口的概念,如图3-46所示。
图3-46 业务口集群连接示意图
-
物理成员端口
成员交换机之间用于集群连接的普通业务口。物理成员端口用于转发需要跨成员交换机的业务报文或成员交换机之间的集群协议报文。
-
逻辑集群端口
逻辑集群端口是专用于集群的逻辑端口,需要和物理成员端口绑定。集群的每台成员交换机上支持两个逻辑集群端口。
相对于集群卡集群而言,业务口集群连线更为灵活,但配置较复杂,需要占用业务板上的业务端口。
集群建立成功后,建议进行以下的配置:
-
为了实现简化网络配置、扩展上行链路带宽、提高可靠性,可以在集群系统上行端口上配置集群Eth-Trunk,并将下行设备双归接入集群系统,配置集群系统下行端口的集群Eth-Trunk。
-
集群系统中另外一个推荐配置就是集群多主检测功能。由于集群系统中两台成员交换机都使用同一个IP地址和MAC地址(集群系统MAC),一个集群分裂后,会产生两个具有相同IP地址和MAC地址的集群系统。为防止集群分裂后,产生两个具有相同IP地址和MAC地址的集群系统,引起网络故障,必须进行IP地址和MAC地址的冲突检查。多主检测MAD是一种检测和处理集群分裂的协议。链路故障导致集群系统分裂后,MAD可以实现集群分裂的检测、冲突处理和故障恢复,降低集群分裂对业务的影响。
MAD检测方式有两种:直连检测方式和代理检测方式。在同一个集群系统中,两种检测方式互斥,不可以同时配置。如果集群系统上配置了集群Eth-Trunk,此时建议采用代理方式的多主检测。直连检测方式需要额外占用端口,且此端口只能用作多主检测(端口间的连接使用普通线缆即可)。与直连方式比较,代理方式不会额外占用端口。
配置注意事项
-
主控板型号为SRUA、SRUB、SRUC以及SRUD的设备建立业务口集群时,必须将系统软件文件(系统启动大包)存放在CF卡中。如果系统软件文件存放在flash,则无法建立业务口集群。
-
两台设备组建集群后,有如下特性在集群环境下不支持:
-
以太时钟同步特性
-
PTP特性(IEEE 1588)
-
在配置多主检测功能时,请注意V200R002C00版本与V200R003C00及之后的版本在命令行格式上是有差异的。同时在V200R002C00版本中,此功能被称作双主检测。
-
不管用于多主检测的链路有几条,只要集群分裂了,备交换机的端口都会被关闭,不再转发业务报文。
-
如果集群重启(包括升级),或者对集群系统主控板进行拔插更换操作,集群系统的MAC地址可能会发生变化。所以,在集群系统重启或更换主控板之前,请先评估集群MAC发生变化后是否对业务产生影响,如存在影响,建议将集群系统MAC地址通过命令set css system-mac chassis chassis-id设置成某个成员交换机的MAC地址,使得集群系统重启后的MAC地址固定为此成员交换机的MAC地址,从而保证集群系统MAC地址的一致。
组网需求
在一个新建的企业网络中,要求核心层具有较高的可靠性,并且希望网络结构简单,易于配置和管理,同时还需要控制设备部署的成本。
如图3-47所示,根据用户需求,核心层SwitchA和SwitchB两台交换机采取业务口集群方式进行组网,其中SwitchA为主交换机,SwitchB为备交换机。汇聚层Switch通过Eth-Trunk连接到集群系统,同时集群系统通过Eth-Trunk接入上行网络。本例中以S9706进行说明。
图3-47 组建集群示意图
配置思路
采用如下的思路配置:
-
为SwitchA和SwitchB分别安装业务板并连接集群线缆。为了增强带宽和可靠性,两台交换机之间通过两块业务板上的四对业务口进行连接。
-
在SwitchA和SwitchB上分别配置集群连接方式,配置集群ID分别为1和2,配置集群优先级分别为100和10,以提高SwitchA成为主交换机的可能。
-
在SwitchA和SwitchB上分别配置两个逻辑集群端口,将四对物理成员端口分别加入这两个逻辑集群端口中。
-
先使能SwitchA的集群功能,然后再使能SwitchB的集群功能,以保证SwitchA成为主交换机。
-
检查集群组建是否成功。
-
配置集群系统的上下行Eth-Trunk,增加转发带宽,提高可靠性。
-
配置多主检测功能,避免集群分裂给网络带来影响。
操作步骤
安装硬件
此处仅介绍两台交换机间集群线缆的连接规则。如果之前还需要安装集群业务板以及需要了解更详细的安装过程,请参见《交换机集群安装指导》。
按照连线规则连接线缆,业务口连接规则如图3-48所示。
图3-48 业务口集群连接规则
业务口集群按照链路的分布,有两种组网形式。
-
1+0组网:每台成员交换机配置一个逻辑集群端口,物理成员端口分布在一块业务板上,依靠一块业务板上物理成员端口与对框的物理成员端口实现集群连接。
-
1+1组网:每台成员交换机配置两个逻辑集群端口,物理成员端口分布在两块业务板上,如图所示,不同业务板上的集群链路形成备份。
集群连线时需注意以下几点:
-
一个逻辑集群端口下的物理成员端口只能与对框的一个逻辑集群口下物理成员端口相连。
-
在1+1组网中,建议两块单板上的集群链路数量保持一致。
出于可靠性考虑,组建上述两种业务口集群组网形式需注意以下几点:
-
出于高可靠性要求,推荐您使用1+1组网,并且推荐配置多主检测功能。
-
一块业务板上建议至少有两个物理成员端口加入到一个逻辑集群端口。
-
上行端口和配置多主检测端口所在单板建议属于非组建集群的业务板。
-
配置集群连接方式、集群ID及集群优先级
# 在SwitchA上配置集群。集群连接方式为业务口集群,集群优先级为100,集群ID采用缺省值1(不需配置)。
<HUAWEI> system-view
[HUAWEI] sysname SwitchA
[SwitchA] set css mode lpu
[SwitchA] set css priority 100
# 在SwitchB上配置集群。集群连接方式为业务口集群,集群ID为2,集群优先级为10。
<HUAWEI> system-view
[HUAWEI] sysname SwitchB
[SwitchB] set css mode lpu
[SwitchB] set css id 2
[SwitchB] set css priority 10
# 检查集群配置信息。
配置完成后,建议执行display css status saved命令查看以上配置信息是否与预期的一致。
查看SwitchA上的集群配置信息。
[SwitchA] display css status saved
Current Id Saved Id CSS Enable CSS Mode Priority Master force
------------------------------------------------------------------------------
1 1 Off LPU 100 Off
查看SwitchB上的集群配置信息。
[SwitchB] display css status saved
Current Id Saved Id CSS Enable CSS Mode Priority Master force
------------------------------------------------------------------------------
1 2 Off LPU 10 Off
-
配置逻辑集群端口
# 配置SwitchA的业务口XGE1/0/1~XGE1/0/2为集群物理成员端口并加入集群端口1,XGE2/0/1~XGE2/0/2为集群物理成员端口并加入集群端口2。
[SwitchA] interface css-port 1
[SwitchA-css-port1] port interface xgigabitethernet 1/0/1 to xgigabitethernet 1/0/2 enable
[SwitchA-css-port1] quit
[SwitchA] interface css-port 2
[SwitchA-css-port2] port interface xgigabitethernet 2/0/1 to xgigabitethernet 2/0/2 enable
[SwitchA-css-port2] quit
# 配置SwitchB的业务口XGE1/0/1~XGE1/0/2为集群物理成员端口并加入集群端口1,XGE2/0/1~XGE2/0/2为集群物理成员端口并加入集群端口2。
[SwitchB] interface css-port 1
[SwitchB-css-port1] port interface xgigabitethernet 1/0/1 to xgigabitethernet 1/0/2 enable
[SwitchB-css-port1] quit
[SwitchB] interface css-port 2
[SwitchB-css-port2] port interface xgigabitethernet 2/0/1 to xgigabitethernet 2/0/2 enable
[SwitchB-css-port2] quit
逻辑集群端口配置完成后,建议执行display css css-port saved命令查看配置的端口是否正确以及状态是否都为Up。
-
使能集群功能
# 使能SwitchA的集群功能并重新启动SwitchA。
[SwitchA] css enable
Warning: The CSS configuration will take effect only after the system is rebooted. The next CSS mode is LPU. Reboot now? [Y/N]:y
# 使能SwitchB的集群功能并重新启动SwitchB。
[SwitchB] css enable
Warning: The CSS configuration will take effect only after the system is rebooted. The next CSS mode is LPU. Reboot now? [Y/N]:y
-
检查集群组建
# 查看指示灯状态。
SwitchA主控板上ACT灯绿色常亮,表示该主控板为集群系统主用主控板,SwitchA为主交换机。
SwitchB主控板上ACT灯绿色闪烁,表示该主控板为集群系统备用主控板,SwitchB为备交换机。
# 通过任意主控板上的Console口本地登录集群,使用命令行查看集群组建是否成功。
<SwitchA> display device
Chassis 1 (Master Switch)
S9706's Device status:
Slot Sub Type Online Power Register Status Role
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
1 - EH1D2X12SSA0 Present PowerOn Registered Normal NA
2 - EH1D2X12SSA0 Present PowerOn Registered Normal NA
3 - EH1D2X12SSA0 Present PowerOn Registered Normal NA
4 - EH1D2G48SEC0 Present PowerOn Registered Normal NA
7 - EH1D2SRUC000 Present PowerOn Registered Normal Master
8 - EH1D2SRUC000 Present PowerOn Registered Normal Slave
PWR1 - - Present PowerOn Registered Normal NA
PWR2 - - Present - Unregistered - NA
CMU2 - EH1D200CMU00 Present PowerOn Registered Normal Master
FAN1 - - Present PowerOn Registered Abnormal NA
FAN2 - - Present - Unregistered - NA
Chassis 2 (Standby Switch)
S9706's Device status:
Slot Sub Type Online Power Register Status Role
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
1 - EH1D2X12SSA0 Present PowerOn Registered Normal NA
2 - EH1D2X12SSA0 Present PowerOn Registered Normal NA
3 - EH1D2X12SSA0 Present PowerOn Registered Normal NA
4 - EH1D2G48SEC0 Present PowerOn Registered Normal NA
7 - EH1D2SRUC000 Present PowerOn Registered Normal Master
8 - EH1D2SRUC000 Present PowerOn Registered Normal Slave
PWR1 - - Present PowerOn Registered Normal NA
PWR2 - - Present PowerOn Registered Normal NA
CMU1 - EH1D200CMU00 Present PowerOn Registered Normal Master
FAN1 - - Present PowerOn Registered Normal NA
FAN2 - - Present PowerOn Registered Normal NA
以上显示信息中,能够查看到两台成员交换机的单板状态,表示集群建立完成。
# 查看集群链路拓扑是否与硬件连接一致。
<SwitchA> display css channel all
CSS link-down-delay: 500ms
Chassis 1 || Chassis 2
================================================================================
Num [CSS port] [LPU Port] || [LPU Port] [CSS port]
1 1/1 XGigabitEthernet1/1/0/1 XGigabitEthernet2/1/0/1 2/1
2 1/1 XGigabitEthernet1/1/0/2 XGigabitEthernet2/1/0/2 2/1
3 1/2 XGigabitEthernet1/2/0/1 XGigabitEthernet2/2/0/1 2/2
4 1/2 XGigabitEthernet1/2/0/2 XGigabitEthernet2/2/0/2 2/2
Chassis 2 || Chassis 1
================================================================================
Num [CSS port] [LPU Port] || [LPU Port] [CSS port]
1 2/1 XGigabitEthernet2/1/0/1 XGigabitEthernet1/1/0/1 1/1
2 2/1 XGigabitEthernet2/1/0/2 XGigabitEthernet1/1/0/2 1/1
3 2/2 XGigabitEthernet2/2/0/1 XGigabitEthernet1/2/0/1 1/2
4 2/2 XGigabitEthernet2/2/0/2 XGigabitEthernet1/2/0/2 1/2
以上显示信息中,可以看出集群链路拓扑与硬件连接一致,表示业务口集群建立成功。
-
配置集群系统与上、下游设备的Eth-Trunk
# 在集群系统上行端口创建Eth-Trunk,并加入Eth-Trunk成员接口。
<SwitchA> system-view
[SwitchA] sysname CSS //给集群系统重新命名
[CSS] interface eth-trunk 10
[CSS-Eth-Trunk10] quit
[CSS] interface xgigabitethernet 1/3/0/4
[CSS-XGigabitEthernet1/3/0/4] eth-trunk 10
[CSS-XGigabitEthernet1/3/0/4] quit
[CSS] interface xgigabitethernet 2/3/0/4
[CSS-XGigabitEthernet2/3/0/4] eth-trunk 10
[CSS-XGigabitEthernet2/3/0/4] quit
# 在集群系统下行端口上创建与SwitchC之间的Eth-Trunk,并加入Eth-Trunk成员接口。
[CSS] interface eth-trunk 20
[CSS-Eth-Trunk20] quit
[CSS] interface gigabitethernet 1/4/0/3
[CSS-GigabitEthernet1/4/0/3] eth-trunk 20
[CSS-GigabitEthernet1/4/0/3] quit
[CSS] interface gigabitethernet 2/4/0/5
[CSS-GigabitEthernet2/4/0/5] eth-trunk 20
[CSS-GigabitEthernet2/4/0/5] quit
# 在集群系统下行端口上创建与SwitchD之间的Eth-Trunk,并加入Eth-Trunk成员接口。
[CSS] interface eth-trunk 30
[CSS-Eth-Trunk30] quit
[CSS] interface gigabitethernet 1/4/0/5
[CSS-GigabitEthernet1/4/0/5] eth-trunk 30
[CSS-GigabitEthernet1/4/0/5] quit
[CSS] interface gigabitethernet 2/4/0/3
[CSS-GigabitEthernet2/4/0/3] eth-trunk 30
[CSS-GigabitEthernet2/4/0/3] return
# 在SwitchE上创建Eth-Trunk,并加入Eth-Trunk成员接口。
<HUAWEI> system-view
[HUAWEI] sysname SwitchE
[SwitchE] interface eth-trunk 10
[SwitchE-Eth-Trunk10] quit
[SwitchE] interface xgigabitethernet 1/0/1
[SwitchE-XGigabitEthernet1/0/1] eth-trunk 10
[SwitchE-XGigabitEthernet1/0/1] quit
[SwitchE] interface xgigabitethernet 1/0/2
[SwitchE-XGigabitEthernet1/0/2] eth-trunk 10
[SwitchE-XGigabitEthernet1/0/2] quit
# 在SwitchC上创建Eth-Trunk,并加入Eth-Trunk成员接口。
<HUAWEI> system-view
[HUAWEI] sysname SwitchC
[SwitchC] interface eth-trunk 20
[SwitchC-Eth-Trunk20] quit
[SwitchC] interface gigabitethernet 1/0/1
[SwitchC-GigabitEthernet1/0/1] eth-trunk 20
[SwitchC-GigabitEthernet1/0/1] quit
[SwitchC] interface gigabitethernet 1/0/2
[SwitchC-GigabitEthernet1/0/2] eth-trunk 20
[SwitchC-GigabitEthernet1/0/2] quit
# 在SwitchD上创建Eth-Trunk,并加入Eth-Trunk成员接口。
<HUAWEI> system-view
[HUAWEI] sysname SwitchD
[SwitchD] interface eth-trunk 30
[SwitchD-Eth-Trunk30] quit
[SwitchD] interface gigabitethernet 1/0/1
[SwitchD-GigabitEthernet1/0/1] eth-trunk 30
[SwitchD-GigabitEthernet1/0/1] quit
[SwitchD] interface gigabitethernet 1/0/2
[SwitchD-GigabitEthernet1/0/2] eth-trunk 30
[SwitchD-GigabitEthernet1/0/2] quit
# 检查配置结果。
上述配置成功后,在任意视图下执行命令display trunkmembership eth-trunk,可以看到Eth-Trunk接口的成员口信息。
以集群系统上Eth-Trunk 10的显示为例。
<CSS> display trunkmembership eth-trunk 10
Trunk ID: 10
Used status: VALID
TYPE: ethernet
Working Mode : Normal
Number Of Ports in Trunk = 2
Number Of Up Ports in Trunk = 2
Operate status: up
Interface XGigabitEthernet1/3/0/4, valid, operate up, weight=1
Interface XGigabitEthernet2/3/0/4, valid, operate up, weight=1
-
配置多主检测功能(此处选择代理方式进行配置,将SwitchC作为代理设备。命令行格式以V200R003C00及之后的版本为例)
# 在集群系统上配置Eth-Trunk接口的代理方式多主检测功能。
<CSS> system-view
[CSS] interface eth-trunk 20
[CSS-Eth-Trunk20] mad detect mode relay //V200R002C00版本命令行格式为dual-active detect mode relay
[CSS-Eth-Trunk20] quit
[CSS] quit
# 配置代理设备SwitchC的代理功能。
[SwitchC] interface eth-trunk 20
[SwitchC-Eth-Trunk20] mad relay //V200R002C00版本命令行格式为dual-active relay
[SwitchC-Eth-Trunk20] quit
[SwitchC] quit
# 检查配置结果。
在集群系统上查看集群多主检测的配置信息。
<CSS> display mad //V200R002C00版本命令行格式为display dual-active
Current MAD domain: 0
MAD direct detection enabled: NO
MAD relay detection enabled: YES
在SwitchC上查看配置的代理信息。
<SwitchC> display mad proxy //V200R002C00版本命令行格式为display dual-active proxy
Mad relay interfaces configured:
Eth-Trunk20
配置文件
-
集群系统的配置文件
#
sysname CSS
#
interface Eth-Trunk10
#
interface Eth-Trunk20
mad detect mode relay
#
interface Eth-Trunk30
#
interface GigabitEthernet1/4/0/3
eth-trunk 20
#
interface XGigabitEthernet1/3/0/4
eth-trunk 10
#
interface GigabitEthernet1/4/0/5
eth-trunk 30
#
interface GigabitEthernet2/4/0/3
eth-trunk 30
#
interface XGigabitEthernet2/3/0/4
eth-trunk 10
#
interface GigabitEthernet2/4/0/5
eth-trunk 20
#
return
-
SwitchC的配置文件
#
sysname SwitchC
#
interface Eth-Trunk20
mad relay
#
interface GigabitEthernet1/0/1
eth-trunk 20
#
interface GigabitEthernet1/0/2
eth-trunk 20
#
return
-
SwitchD的配置文件
#
sysname SwitchD
#
interface Eth-Trunk30
#
interface GigabitEthernet1/0/1
eth-trunk 30
#
interface GigabitEthernet1/0/2
eth-trunk 30
#
return
-
SwitchE的配置文件
#
sysname SwitchE
#
interface Eth-Trunk10
#
interface XGigabitEthernet1/0/1
eth-trunk 10
#
interface XGigabitEthernet1/0/2
eth-trunk 10
#
return
推荐阅读:
— 年度热文 —