大量TIME_WAIT造成的影响
在高并发短连接的TCP服务器上,当服务器处理完请求后立即主动正常关闭连接。这个场景下会出现大量socket
处于TIME_WAIT
状态。如果客户端的并发量持续很高,此时部分客户端就会显示连接不上。
有两个方面需要注意
- 高并发可以让服务器在短时间范围内同时占用大量端口,而端口的范围是0~65535,并不是很多。
- 短连接表示“业务处理+传输数据的时间远远小于TIME_WAIT的时间”的连接。
在实际业务场景中,一般长连接对应的业务的并发量并不会很高。
综合这两个方面,持续的到达一定量的高并发短连接,会使服务器因端口资源不足而拒绝为一部分客户服务。同时,这些端口都是服务器临时分配,无法用SO_REUSEADDR
选项解决这个问题。
如果处理TIME_WAIT过多
编辑内核文件/etc/sysctl.conf
,加入以下内容
参数 | 功能 |
---|---|
net.ipv4.tcp_syncookies = 1 | 表示开启SYN Cookies 。当出现SYN 等待队列溢出时,启用cookie 来处理,可防范少量SYN 攻击,默认为0,表示关闭。 |
net.ipv4.tcp_tw_reuse = 1 | 表示开启重用。允许将TIME_WAIT sockets 重新用于新的TCP连接,默认为0,表示关闭。 |
net.ipv4.tcp_tw_recycle = 1 | 表示开启TCP连接中TIME_WAIT sockets 的快速回收,默认为0,表示关闭。 |
net.ipv4.tcp_fin_timeout | 修改默认的TIMEOUT时间 |
如果以上配置调优后性能还不理想,可以继续修改以下配置。
//tcp发送keepalive的频率,缺省是2小时,改为20分钟
net.ipv4.tcp_keepalive_time = 1200;
//表示用于向外连接的端口范围,缺省情况下:32768到61000,改为1024到65000
net.ipv4.ip_local_port_range = 1024 65000;
//表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数
net.ipv4.tcp_max_syn_backlog = 8192;
//表示系统保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立即被清除并打印警告信息
net.ipv4.tcp_max_tw_buckets = 5000;