随着网络的快速普及和应用的日益深入,企业通过数据网络将各种增值业务进行了广泛部署,因此企业网络的建立与维护的持续正常运转对于现代活动的开展就变得非常重要了。对于大型企业,网络宕机所造成的损失甚至可以高达每小时数百万元。银行不能营业、机票不能订购、email不能收发……网络的故障不仅造成企业经济上的损失,还会带来客户忠诚度的降低,及企业形象等额外损失。

随着企业的发展,企业的数据库中保存着公司的越来越多的关键性数据。企业为防止系统崩溃采取的措施多种多样,从核心数据集中管理减少故障点,到数据库恢复软件和全面冗余的同步交易处理系统。但这些措施大都局限于七层模型的上三层。作为信息共享和数据通信的基础,网络的中断可能影响大量业务,造成重大损失。作为业务承载主体的基础网络,其高可用性因此日益成为企业关注的焦点。

那么,什么样的网络称之为高可用性的网络呢?

1、网络出现故障的频率

作为一个成熟稳健的网络,绝不能频繁的出现故障。只要网络出现故障,即使是很短的时间内的网络故障,也会影响业务的运行。尤其是对丢包和时延敏感的业务,比如应用非常广泛的语音和视频等业务,此时一旦出现网络故障,将会影响通话的质量和视频的质量。例如:通话中话音不清晰、噪音大、通话中断等。在通过网络进行视频培训中,视频画面延迟大,出现抖动、马赛克,有可能讲师的画面已经翻页了,而观众的画面还停留在上一页。所以,这种故障如果出现的频率频繁是无法让人忍受的。

2、网络出故障恢复的时间

网络的组建及其应用后,难免会出现故障。但是当网络出现故障时,针对网络恢复的措施就显得十分重要。毕竟,恢复一个出故障的网络如果需要几个小时,甚至几天才能恢复的话,那么这个网络也不能称之为高可用性的网络。

3、核心设备的冗余

对于网络的重要部分或设备应在网络设计上考虑冗余和备份,减少单点故障对整个网络的影响。在考虑设备选型和网络设计时也应该充分考虑到核心设备、关键性设备,电源,引擎,链路等方面的冗余性。

事实上,故障少、故障恢复时间短基本就概括了高可用性网络的特点。在实际网络中,软、硬件的版本质量是有极限的,并且也避免不了各种人为和非技术因素造成的网络故障和服务中断。基于这个原因,开发能让网络迅速从故障中恢复的技术非常重要。事实上,如果网络总是能在不中断(绝大部分)业务的情况下恢复,对多数用户,就其业务体验来说,甚至可以认为是无故障的。

如何设计高可用性网络?笔者建议从以下几个方面来考虑:

1、网络结构可靠性。

任何核心节点之间建议形成三角连接拓扑或口字形拓扑,即任何核心设备通过两条线路与另外两台设备互联,实现设备、线路冗余。

(1) 上连设备(通往internet或企业总部)使用两台设备互为备份,任何一台出现故障流量均会瞬间切换,保证网络健壮性。

(2) 核心层建议采用冗余设备的组网方案,所有骨干设备均采用双线路连接到核心设备上。

(3) 汇聚层也建议采用冗余设备连接到核心设备;汇聚层设备之间通过接口互联,任何一台设备故障或物理链路中断均可自动切换。

(4) 接入层设备采用线路捆绑连接到汇聚层,提高链路的带宽和稳定性。

2、网络线路可靠性需求。

广域网互联线路建议使用两家不同的运营商互联,减少非己方原因造成的网络故障,也避免了由单一运营商网络故障而导致企业自身的网络故障。

3、 网络设备可靠性需求。

(1) 所有核心网络设备除自身具备双电源模块、双引擎保护外,建议具有双机热备功能。

(2) 所有核心网络设备建议应具有模块化、高扩展×××,具有满足日后升级扩容的能力。

4、网络性能可靠性。

网络应具有应对突发×××量的能力。性能应满足业务系统对网络吞吐、时延、处理速度等方面的要求。

5、路由协议可靠性。

路由协议需选择稳定、兼容性好的路由协议。避免由于网络中存在私有协议而限制了网络的扩容和改造。

6、网络配置可靠性。

核心网络设备配置应简单,易于日常管理和紧急情况下的维护。

7、网络设备可管理性。

网络的管理能力是管理员了解网络的一个窗口。也是监控和维护网络的一个重要工具。网络管理工具可以帮助网络管理员识别关键资源、流量模式及网络设备的性能,还能用来配置网络设备的故障阀值,提交精确的监控和故障报告。

总而言之,网络的高可用性现在已经成为系统可用性中密不可分的一部分。专家认为,为了支持网络所承载的日益增长的应用,网络建成后的可用性必须增加到99.99%以上。

高可用性网络
1. 服务器 群集 【LB HA HP】
2.路由设备 HSRP VRRP
3.网络接口 bond
4。链路 LAN stp rstp mstp 聚合
wan
1.浮动静态路由
2.standby interface
interface 接口 【骨干链路接口】
standby interface 接口 【备份链路接口】
standby timer enable-delay 时常 【启用备份接口的延迟】
standby timer disable-delay 时常 【启用骨干接口的延迟】
3. 链路捆绑 mp multi-ppp

4.链路聚合(端口汇聚)

案例

拓扑图

p_w_picpath

1.浮动静态路由

配置一条主链路,一条辅助链路!正常情况使用主链路,主链路出现故障,切换到辅助链路!

H3C

主线路s0-s0 采用ospf 默认度量值是10,辅助线路s1-s1 配置静态路由,默认度量值是60,无需调整,数据包默认值走s0-s0链路

R1 配置如下:

ospf enable

int s0 area 0

ospf enable

int e1 area 0

ospf enable

ip route 192.168.20.0 24 192.168.2.2

R2 配置如下:

ospf enable

int s0

ospf enable area 0

int e1

ospf enable area 0

ip route 192.168.10.0 24 192.168.2.1

CISCO

主线路s0-s0 采用ospf 默认度量值是110,辅助线路s1-s1 配置静态路由,默认度量值是1, 因此需要调整静态路由的度量值,使得数据包默认值走s0-s0链路.

R1 配置如下:

router ospf 10

network 192.168.1.0 0.0.0.255 area 0

network 192.168.10.0 0.0.0.255 area 0

exit

ip route 192.168.20.0 255.255.255.0 192.168.2.2 130

R2 配置如下:

router ospf 10

network 192.168.1.0 0.0.0.255 area 0

network 192.168.20.0 0.0.0.255 area 0

exit

ip route 192.168.10.0 255.255.255.0 192.168.2.1 130

测试

p_w_picpath

当链路S0-S0坏掉时。

p_w_picpath

p_w_picpath

2.备份链路

备份链路使用即两条链路性能差别不大,配置一条链路为active链路,另一条为standby链路!active链路出现故障,切换到standy链路!

H3C:

R1 配置如下:

ip route 192.168.20.0 24 192.168.1.2

ip route 192.168.20.0 24 192.168.2.2

int s0

standby int s1

standby time enable-delay 10 \\设置standby链路生效延时10s

standby time disable-delay 10 \\设置acitve链路失效延时10s

R2配置如下:

ip route 192.168.10.0 24 192.168.1.1

ip route 192.168.10.0 24 192.168.2.1

int s0

standby int s1

standby time enable-delay 10 \\设置standby链路生效延时10s

standby time disable-delay 10 \\设置acitve链路失效延时10s

3. 链路捆绑

将性能较差的链路聚合为一条链路,即提高链路性能,有确保了相互备份!较前两中方法具有较大的优势! 需要聚合端口无需配置IP地址,聚合端口配置一IP地址!

H3C

R1 配置如下:

int virtual-template 1

ip add 192.168.3.1 24

int s0

ppp mp

ppp mp int virtual-template 1

int s1

ppp mp int virtual-template 1

ppp mp

R2 配置如下:

Int virtual-template 1

ip add 192.168.3.2 24

int s0

ppp mp int virtual-template 1

ppp mp

int s1

ppp mp int virtual-template 1

ppp mp

测试:

C:\Users\zhangzhen>ping 192.168.10.100 -t

正在 Ping 192.168.10.100 具有 32 字节的数据:
来自 192.168.10.100 的回复: 字节=32 时间=4ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=3ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=6ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=2ms TTL=62
请求超时。
来自 192.168.10.100 的回复: 字节=32 时间=18ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=5ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=4ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=2ms TTL=62
来自 192.168.10.100 的回复: 字节=32 时间=4ms TTL=62