对于TCP连接来说,如果客户端由于一些异常情况导致断网,从而未能向服务器发起FIN关闭消息,服务端在没有设置存活检测的情况下,该连接会在一定时间内保持存在,有可能会使服务器接入资源耗尽,导致accept失败。
解决这个问题,可以通过使用心跳包的方法来检测连接是否存活。socket 中存在 SO_KEEPALIVE 选项,可以用来解决刚刚提到的问题。
2、更改文件 /etc/sysctl.conf,在文件中添加:
解决这个问题,可以通过使用心跳包的方法来检测连接是否存活。socket 中存在 SO_KEEPALIVE 选项,可以用来解决刚刚提到的问题。
使用 SO_KEEPALIVE 将会检测对方主机是否崩溃,避免服务器永远阻塞于TCP连接的输入。设置该选项后,如果2小时内在此套接口的任一方向都没有数据交换,TCP就自动给对方发一个 keepalive probe。此时会出现以下三种情况:
1、对方接收一切正常:以期望的ACK响应。2小时后,TCP将发出另一个keepalive probe。
2、对方已崩溃且已重新启动:以RST响应。套接口的待处理错误被置为 ECONNRESET,套接口本身则被关闭。
3、对方无任何响应:源自berkeley的TCP发送另外8个探测分节,相隔75秒一个,试图得到一个响应。在发出第一个探测分节11分钟 15秒后若仍无响应就放弃。套接口的待处理错误被置为ETIMEOUT,套接口本身则被关闭。
在路径 /proc/sys/net/ipv4/下 可以看到 tcp_keepalive_intvl、tcp_keepalive_probes、tcp_keepalive_time三个文件,分别对应:两次KeepAlive探测间的时间间隔(75)、判定断开前的KeepAlive探测次数(9)、发起KeepAlive探测的定时器时间(7200)。改变这些设置可以通过两种方法:
1、向三个文件中直接写入参数,但是系统重启后需要重新设置;
sysctl -w net.ipv4.tcp_keepalive_intvl=30
2、更改文件 /etc/sysctl.conf,在文件中添加:
net.ipv4.tcp_keepalive_intvl = 30
net.ipv4.tcp_keepalive_probes = 3
net.ipv4.tcp_keepalive_time = 300