- 查看所有的SOCKET状态数
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
说明:
TIME_WAIT 168 连接等待
CLOSE_WAIT 1
SYN_SENT 2
ESTABLISHED 38 已建立连接
- 使用下列命令查看当前服务端的被连接数目
netstat -nat|grep -i "7070"|wc -l
说明: 显示当前有多少个连接。
问题: 什么原因导致堆积了这么多的等待SOCKET?
根据TCP协议定义的3次握手断开连接规定,发起socket主动关闭的一方 socket将进入TIME_WAIT状态,TIME_WAIT状态将持续2个MSL(Max Segment Lifetime),在Windows下默认为4分钟,即240秒,TIME_WAIT状态下的socket不能被回收使用. 具体现象是对于一个处理大量短连接的服务器,如果是由服务器主动关闭客户端的连接,将导致服务器端存在大量的处于TIME_WAIT状态的socket, 甚至比处于Established状态下的socket多的多,严重影响服务器的处理能力,甚至耗尽可用的socket,停止服务. TIME_WAIT是TCP协议用以保证被重新分配的socket不会受到之前残留的延迟重发报文影响的机制,是必要的逻辑保证.
解决方案:
大部分情况下都是由于客户端没有主动关闭SOCKET连接造成了以上现象。
服务端的优化:
发现系统存在大量TIME_WAIT状态的连接,通过调整内核参数解决,
编辑文件,加入以下内容:
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30
/sbin/sysctl -p
让参数生效。
net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。
net.ipv4.tcp_fin_timeout 修改系統默认的 TIMEOUT 时间
客户端的优化
在每次处理完毕之后,一定要记得CLOSE()掉