最近在做东西的时候,用到TCP通信,我的程序为客户端。当时就想要用epoll来监听socket是否发生连接断开的情况。我用epoll注册监听socket的描述符,以及监听EPOLLRDHUP事件,可以成功监听到了对端服务器正常关闭。但是如果直接拔掉网线、或者使用其他方式断网,那么epoll是没有反应,EPOLLRDHUP无法监听到对端socket是否被关闭,此时用recv函数和send()函数的返回值也不能够确定对方是否断开连接。
查找了一些资料后得知,如果我们想要socket能够获知网络物理上已经断开从而结束连接,则需要加入保活机制,即使用setsockopt函数和SO_KEEPALIVE等宏定义给socket设置保活:
/* Set socket FD's option OPTNAME at protocol level LEVEL
to *OPTVAL (which is OPTLEN bytes long).
Returns 0 on success, -1 for errors. */
extern int setsockopt (int __fd, int __level, int __optname,
__const void *__optval, socklen_t __optlen) __THROW;
实际设置代码如下:
int yourTcpClinetFunc()
{
int sockfd=socket(AF_INET,SOCK_STRERAM,0);
if(sockfd<0){
perror("socket error:");
return -1;
}
struct sockaddr_in sevrddr;
sevrddr.sin_family=AF_INET;
sevrddr.sin_addr.s_addr=inet_addr("ip地址");
sevrddr.sin_port=htons(3333);
if(::connect(sockfd,(struct sockaddr*)&sevrddr,sizeof(sevrddr))<0)
{
perror("Connect server failed:");
::close(sockfd);
return -1;
}
/*开始设置保活机制*/
int val=1;
if (setsockopt(sockfd, SOL_SOCKET, SO_KEEPALIVE, &val, sizeof val) != 0)
{
perror("Set SO_KEEPALIVE fail");
return -1;
}
val=10;
/* val秒钟无数据,触发保活机制,发送保活包 */
if (setsockopt (sockfd, SOL_TCP, TCP_KEEPIDLE, &val, sizeof val) != 0)
{
perror("Set TCP_KEEPIDLE fail");
return -1;
}
val=5;
/* 如果没有收到回应,则val秒钟后重发保活包 */
if (setsockopt (sockfd, SOL_TCP, TCP_KEEPINTVL, &val, sizeof val) != 0)
{
perror("Set TCP_KEEPINTVL fail");
return -1;
}
val=2;
/* 连续val次没收到保活包,视为连接失效 */
if (setsockopt (sockfd, SOL_TCP, TCP_KEEPCNT, &val, sizeof val) != 0)
{
perror("Set TCP_KEEPCNT fail");
return -1;
}
/*其他的代码*/
/*...*/
return 0;
}