左雪菲的专栏

欢迎访问我的个人网站:http://www.hootina.org

网络编程难点解析(一) —— 网络异常检查

一、本文目的

在涉及网络编程的实际项目应用中,由于网络不可能一直处于理想状态,TCP长连接也可能随时正常或异常地断开,如果不予处理,那么就可能因此而给程序带来很多潜在的问题。 编写该文档的目的就在于针对网络程序中可能遇到的各种问题,拿出来与大家探讨一下具体问题的解决方案,同时本人将前期调研的一些解决方案列出来,抛砖引玉,希望可以集思广益,寻求到更加合理的解决方案。


二、网络断开时机

1、正常网络断开

(1) CS 一方调用 Close

(2) CS 一方程序正常退出,如Ctrl + C 事件可以被系统检测到,对应的套接字也将被系统标记为已断开。

2、异常网络断开

(1) CS 一方网线被拨出

(2) CS 之间路由故障,物理连接断开

(3) CS 一方断电或当机

(4) CS 一方无线信号不佳或无线接口被关闭

(5) CS 一方更改 IP 事件无法被系统检测到,这个时候读数据不会出错,只会一直阻塞着;写数据在缓冲区未满之前也不会返回错误。若无法及时检测到断开事件,对某些应用场景而言可能存在致命的错误。如服务端维护的客户端在线信息错误等。


三、网络断开常用检测方法

1、处理正常网络断开

(1) select 捕捉可读事件,read返回0

(2) epoll 捕捉可读事件,read返回0

(3) 主动 read 返回错误

(4) 主动 write 返回错误

2、处理异常网络断开

(1) 应用层KeepAlive检测

在应用层协议加入心跳握手机制,维护服务端跟客户端之间的连通状态,是最普遍最保险的办法。 客户端定时向服务端发送探测包,若服务端回应则说明服务端在线,否则作离线处理;服务端也可对长期未发送探测包的客户端作离线处理。 该方案所有系统都支持,跨平台性好;对端跟自身出现网络故障都能检测到。不足之处在于它需要应用层协议支持,程序内部需要长期维护心跳握手包,相对比较繁琐。

(2) 传输层KeepAlive检测

除了应用层 KeepAlive 检测机制外,TCP 内部也集成了 KeepAlive 机制,默认关闭,开启它很方便。对端跟自身出现网络故障都能检测到。但不是所有的系统都支持,而且有些系统虽然支持但会影响到所有套接字,消耗额外的宽带和流量,不建议使用。

//启用心跳机制,如果您想关闭,将keepAlive置零即可  
setsockopt(fd,SOL_SOCKET,SO_KEEPALIVE,(void*)&keepAlive,sizeof(keepAlive));  
//启用心跳机制开始到首次心跳侦测包发送之间的空闲时间  
setsockopt(fd,SOL_TCP,TCP_KEEPIDLE,(void *)&start,sizeof(start));  
//两次心跳侦测包之间的间隔时间  
setsockopt(fd,SOL_TCP,TCP_KEEPINTVL,(void *)&interval,sizeof(interval));  
//探测次数,即将几次探测失败判定为TCP断开  
setsockopt(fd,SOL_TCP,TCP_KEEPCNT,(void *)&count,sizeof(count));  

(3) 网络层KeepAlive检测

Ping 命令几乎是所有平台的网络连通性检测命令,走网络层 ICMP 协议,这里考虑使用 popen 函数调用系统自带的 Ping 命令来封装网络连通性检测函数。它实际上也是一种网络层的 KeepAlive 机制。

int checkConnect(char *dst, int cnt)  
{  
    FILE *stream;  
    sprintf(cmdBuf, "ping %s -c %d -i 0.2 | grep time= | wc -l", dst, cnt);  
    stream = popen(cmdBuf, "r");  
    fread(recvBuf, sizeof(char), sizeof(recvBuf)-1, stream);  
    pclose(stream);  
    if (atoi(recvBuf) > 0) return 0;  
    return -1;  
}  
dst 指定要检测的目的地址,cnt 指定 Ping 尝试的次数,-i 参数指定 Ping 尝试的超时时间。
(4) 应用层监控内核消息机制
Netlink 是一种特殊的套接字,为2.6.14及更高版本的Linux所特有,通过它,应用层程序可以方便地向内核订制指定消息,如网卡上下线。也可以设置或查询配置,如IP、路由、网络流量信息等。
a、创建一个 netlink 套接字:

fd = socket(AF_NETLINK, SOCK_RAW, NETLINK_ROUTE);  

b、绑定路由多播组,监控网卡信息:

addr.nl_family = AF_NETLINK;  
   addr.nl_groups = RTNLGRP_LINK; //指定接收路由多播组消息  
   bind(fd, (struct sockaddr*)&addr, sizeof(addr)); 


c、监听套接字,一旦可读,解析其内容,实时监控网卡上下线事件。

优点:实时性高,使用方便。

缺点:跨平台性不佳,只能检测自身网络故障。

(5) 应用层网卡信息轮询机制

网卡信息轮询机制就是定期调用 ioctl 函数执行如下操作:

struct ifconf ifc;  
   struct ifreq ifrcopy;  
   //获取网卡信息列表  
   ioctl(fd, SIOCGIFCONF, (char *)&ifc);  
   //获取网卡上下线状态  
   ioctl(fd, SIOCGIFFLAGS, &ifrcopy);  
   //获取 MAC 地址  
   ioctl(fd, SIOCGIFHWADDR, (char *)(&ifrcopy);  
   //获取 IP 地址  
   ioctl(fd, SIOCGIFADDR, (char *)&ifrcopy);  
   //获取广播地址  
   ioctl(fd, SIOCGIFBRDADDR, &ifrcopy)); 

缺点:

a、跨平台性不佳。

可以成功移植到 Linux、AndroidWindows平台,但由于 iPhone 平台上获取MAC跟IP的参数不同,需特殊处理。

b、实时性跟灵活性不高。

c、耗费资源,影响性能。

d、只能检测自身网络故障。


文章来源:

http://www.cpplive.com/html/1670.html





阅读更多
版权声明:欢迎访问我的个人网站:http://www.hootina.org https://blog.csdn.net/analogous_love/article/details/78388037
个人分类: 网络编程难点解析
想对作者说点什么? 我来说一句

网络异常解决办法

2013年09月15日 2.28MB 下载

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭