TCP连接探测中的Keepalive和心跳包. 关键字: tcp keepalive, 心跳, 保活

TCP Keepalive协议层心跳包机制:

在TCP中有一个Keep-alive的机制可以检测死连接,原理很简单,TCP会在空闲了一定时间后发送数据给对方:
1.如果主机可达,对方就会响应ACK应答,就认为是存活的。
2.如果可达,但应用程序退出,对方就发RST应答,发送TCP撤消连接。
3.如果可达,但应用程序崩溃,对方就发FIN消息。
4.如果对方主机不响应ack, rst,继续发送直到超时,就撤消连接。这个时间就是默认
的二个小时。

在我的应用中有如下场景:

当客户端连接到服务器之后,服务器会不停的推送数据到客户端,为了检测客户端非正常断开时,服务器不能检测到后回收资源,因此使用了协议层的Keepalive心跳机制。但是在这种情况下,Keepalive机制是不能启到作用的。自己也分析了原因,貌似客户端非正常断开时,服务器write数据是一直成功的,不能保证链路空闲,因此keepalive机制不能启作用,有大神知道原因不,可以交流下??????


1. TCP保活的必要性

1) 很多防火墙等对于空闲socket自动关闭

2) 对于非正常断开服务器并不能检测到为了回收资源必须提供一种检测机制.


2. 导致TCP断连的因素

如果网络正常, socket也通过close操作来进行优雅的关闭那么一切完美可是有很多情况比如网线故障客户端一侧突然断电或者崩溃等等这些情况server并不能正常检测到连接的断开


3. 保活的两种方式:

1) 应用层面的心跳机制

自定义心跳消息头一般客户端主动发送服务器接收后进行回应(也可以不回应). 这里不进行详述.

PS: 有人从软件的功能角度列出第三种方式就是通过第三方软件来进行探测确定连接的有效性这种方式局限性很大而且不属于软件内部的功能实现不进行讨论.

2) TCP协议自带的保活功能

打开keep-alive功能即可具体属性也可以通过API设定.


4. 两种方式的优劣性

TCP协议自带的保活功能使用起来简单减少了应用层代码的复杂度推测也会更节省流量因为一般来说应用层的数据传输到协议层时都会被加上额外的包头包尾TCP协议提供的检活其发的探测包理论上实现的会更精妙(用更少的字节完成更多的目标), 耗费更少的流量.

由应用自己实现的应用层的心跳为心跳消息额外定义一个消息类型就可以了就是应用正常的消息包只是这个包特殊点专门用来检活而已通常比较小可能只有消息头就可以了除非需要额外的信息

应用层心跳的好处我个人的理解有两点

一是比较灵活因为协议层的心跳只能提供最纯粹的检活功能但是应用层自己可以随意控制包括协议可能提供的是秒级的但是你想做成毫秒级的都任意(虽然实际几乎不会有这种时间级别的心跳), 包里还甚至可以携带额外的信息这些都是灵活之处.

二是通用应用层的心跳不依赖协议如果有一天不用TCP要改为UDP协议层不提供心跳机制了但是你应用层的心跳依旧是通用的可能只需要做少许改动就可以继续使用.

应用层心跳的不好的地方也很显而易见增加开发工作量由于应用特定的网络框架还可能很增加代码结构的复杂度再就是根据上面的推测应用层心跳的流量消耗还是更大的毕竟这本质上还是个普通的数据包.


5. 到底选用那种心跳方式?

优劣点第4节已经进行了阐述因此如果能确定你们更换协议的可能性非常小同时只是需要检活的功能那么用协议自带的就绝对OK使用简单而且高效有些自负的人总喜欢用自己搞的来代替成熟协议自带的东西代替系统内核提供的东西其实往往你应用层实现的东西都是更拙劣的网上看了一些关于协议的Keep-alive不靠谱的说法也都比较空想和想当然都没有拿出任何事实论据或实验数据这点大家有见解欢迎交流哈~


6. 类Unix平台如何使用Keep-alive

keepalive默认是关闭的因为虽然流量极小毕竟是开销因此需要用户手动开启有两种方式开启.

1) 在代码里针对每个socket进行单独设定使用起来灵活.

除了keepAlive 开关还有keepIdle, keepInterval, keepCount 3个属性使用简单如下:

  1. int keepAlive = 1;   // 开启keepalive属性. 缺省值: 0(关闭)  
  2. int keepIdle = 60;   // 如果在60秒内没有任何数据交互,则进行探测. 缺省值:7200(s)  
  3. int keepInterval = 5;   // 探测时发探测包的时间间隔为5秒. 缺省值:75(s)  
  4. int keepCount = 2;   // 探测重试的次数. 全部超时则认定连接失效..缺省值:9(次)  
  5. setsockopt(s, SOL_SOCKET, SO_KEEPALIVE, (void*)&keepAlive, sizeof(keepAlive));  
  6. setsockopt(s, SOL_TCP, TCP_KEEPIDLE, (void*)&keepIdle, sizeof(keepIdle));  
  7. setsockopt(s, SOL_TCP, TCP_KEEPINTVL, (void*)&keepInterval, sizeof(keepInterval));  
  8. setsockopt(s, SOL_TCP, TCP_KEEPCNT, (void*)&keepCount, sizeof(keepCount));  

使用时需要#include <netinet/tcp.h>, 否则SOL_TCPTCP_KEEPIDLE3个宏找不到.

ps: 忍不住吐槽一下, 网上大量毫不负责的转载, 千篇一律的搜索结果, 很多人根本都没进行过任何验证吧. 为了找这么个头文件都费了不小的事. 大多数帖子里的说的都是不可用的.

2) 修改配置文件对整个系统所有的socket有效.

我们可以用cat命令查看到系统中这几个默认的值.

#cat /proc/sys/net/ipv4/tcp_keepalive_time  7200  

#cat /proc/sys/net/ipv4/tcp_keepalive_intvl  75  

#cat /proc/sys/net/ipv4/tcp_keepalive_probes  9

修改它们:

#echo 60 > /proc/sys/net/ipv4/tcp_keepalive_time  

#echo 5 > /proc/sys/net/ipv4/tcp_keepalive_intvl  

#echo 3 > /proc/sys/net/ipv4/tcp_keepalive_probes


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值