1楼 发表于 2005-12-20 12:31 
相信现在很多公司或网吧开始考虑双线接入,来实现网络的均衡负载或冗余(备份)线路,保持网络的不间断性。但是如何才能检测某条线路断了呢?有以下几种办法:

1. 物理连接中断(比如网线出现问题)

    这个可以通过SNMP来检测(需要现安装 net-snmp 包),如下:

   先查看各网卡的设备描述编号:
   # snmpwalk -v 1 -c public localhost|grep ifDescr
   IF-MIB::ifDescr.1 = STRING: lo
   IF-MIB::ifDescr.2 = STRING: dummy0
   IF-MIB::ifDescr.3 = STRING: eth0
   IF-MIB::ifDescr.4 = STRING: eth1
   IF-MIB::ifDescr.5 = STRING: tunl0
   IF-MIB::ifDescr.6 = STRING: gre

   上面显示 eth0 的编号是3

   查看 eth0 的状态:
   # snmpwalk -v 1 -c public localhost IF-MIB::ifOperStatus.3
   IF-MIB::ifOperStatus.3 = INTEGER: up(1)

   如果显示 up 表示连接正常,显示 down 表示网络中断了。

补充:(感谢 孙轩 兄的建议)
   更简单的办法是利用 ethtool 工具,下载地址:<url>[url]http://directory.fsf.org/All_Packages_in_Directory/ethtool.html</url>[/url]


编译安装:

  # ./configure && make && make install

测试:

  # ethtool eth0
    ....
    Link detected: yes

如果最后一行显示 yes 表示连接正常,显示 no 表示网络中断了。

2. 逻辑连接中断(比如网关的线路出了问题等)

   可以通过每10s发送一个小的ping包到网关,看是否有回应,一般网关都是允许ping的。

    这个可以通过一个expect程序(netwatch.exp)来完成,下面这个脚本发送一个字节为1的ping包给网关,并分析ping的输出信息,如果为 0% packet loss,表示正常,以0退出。如果超时(1秒钟),以1退出。

#!/usr/bin/expect

set target [lindex $argv 0]
set timeout 1
spawn ping -c 1 -s 1 $target

expect {
    " 0% packet loss" {
        exit 0
    }
    timeout {
        exit 1
    }
}

比如网关1为192.168.1.1,网关2为192.168.2.1,那么要监测这两个网关的话,可以这样:

#!/bin/sh

netwatch.exp 192.168.1.1
result1=$?
netwatch.exp 192.168.2.1
result2=$?
if [ "$result1" eq 0 ] && [ "$result2" eq 0 ] ; then

# 如果上次检测时连接丢失,而此次恢复正常
    if [ -e /var/run/lost-connection ] ; then
       do some recovery action here ...
       rm /var/run/lost-connection
    fi

# 如果网关1不可达
elif [ "$result1" ne 0 ] ; then
   change default route to 192.168.2.1
   do some action here, such as iptables NAT

   # 创建连接丢失标识
   touch /var/run/lost-connection

# 如果网关2不可达
elif [ "$result2" ne 0 ] ; then
   change default route to 192.168.1.1
   do some action here, such as iptables NAT

   # 创建连接丢失标识
   touch /var/run/lost-connection
fi

虽然可以通过iptables的MASQUERADE来实现自动切换,但是如果加了策略路由,就不行了。

以上只是个人的想法,希望起到抛砖引玉的作用,如果大家有更好的办法或建议,请不要吝啬提出来哦!

 
2楼 发表于 2005-12-20 13:37 
要在用户态来做,一个笨笨的办法以是,重写一个mii-tool中是否断线的代码,然后每隔一段时间检测一次!我就是这样的……



 
4楼 发表于 2005-12-20 15:38 


QUOTE:
原帖由 coolend 于 2005-12-20 14:57 发表
不错,是个好主意,谢谢回复!

但是有的网卡设备不支持 mii-tool 啊,比如我的两块网卡(RTL-8139)好像不行:

[code]
# mii-tool
SIOCGMIIPHY on 'eth0' failed: Operation not supported
SIOCGMIIPHY o ...

不可能喔……况且我又不是说mii-tool,我是说模仿它的方法从内核中读……当然,我觉得这个办法还是笨了点


 
 
13楼 发表于 2005-12-21 18:48 
我的方法:

ifconfig eth0 |grep collisions |awk  '{print $1}' |awk -F: '{print $2}'


 
14楼 发表于 2005-12-22 11:35 


QUOTE:
原帖由 coolend 于 2005-12-20 14:57 发表
不错,是个好主意,谢谢回复!

但是有的网卡设备不支持 mii-tool 啊,比如我的两块网卡(RTL-8139)好像不行:

[code]
# mii-tool
SIOCGMIIPHY on 'eth0' failed: Operation not supported
SIOCGMIIPHY o ...

不是 网卡设备不支持  是这网卡在单前内核下配合的驱动模块不支持 mii-tool的
你可以升级内核,或升级驱动。