TCP通信过程中time_wait和close_wait产生过多的原因和解决方法

Kuany_

已于 2022-07-19 08:23:42 修改

阅读量1.6w

点赞数 18

分类专栏：面经计算机网络文章标签： socket tcp

于 2020-09-17 18:10:19 首次发布

本文链接：https://blog.csdn.net/weixin_44718794/article/details/108649255

版权

面经同时被 2 个专栏收录

21 篇文章 4 订阅

订阅专栏

计算机网络

11 篇文章 0 订阅

订阅专栏

TCP通信过程中time_wait，和close_wait产生过多的原因和解决方法

1. time_wait过多产生原因
2.time_wait过多解决方法
3.close_wait过多原因
4.close_wait过多的解决方案

在这里插入图片描述

1. time_wait过多产生原因

正常的TCP客户端连接在关闭后，会进入一个TIME_WAIT的状态，持续的时间一般在1-4分钟，对于连接数不高的场景，1-4分钟其实并不长，对系统也不会有什么影响，
但如果短时间内（例如1s内）进行大量的短连接，则可能出现这样一种情况：客户端所在的操作系统的socket端口和文件描述符被用尽，系统无法再发起新的连接！

举例来说：
假设每秒建立了1000个短连接（Web场景下是很常见的，例如每个请求都去访问memcached），假设TIME_WAIT的时间是1分钟，则1分钟内需要建立6W个短连接，由于TIME_WAIT时间是1分钟，这些短连接1分钟内都处于TIME_WAIT状态，都不会释放，而Linux默认的本地端口范围配置是：net.ipv4.ip_local_port_range = 32768 61000不到3W，因此这种情况下新的请求由于没有本地端口就不能建立了。

2.time_wait过多解决方法

可以改为长连接，但代价较大，长连接太多会导致服务器性能问题；
修改ipv4.ip_local_port_range，增大可用端口范围，但只能缓解问题，不能根本解决问题；
客户端程序中设置socket的SO_LINGER选项；
客户端机器打开tcp_tw_recycle和tcp_timestamps选项；
客户端机器打开tcp_tw_reuse和tcp_timestamps选项；
客户端机器设置tcp_max_tw_buckets为一个很小的值；

参考：https://www.cnblogs.com/cheyunhua/p/9082674.html

3.close_wait过多原因

close_wait 按照正常操作的话应该很短暂的一个状态，接收到客户端的fin包并且回复客户端ack之后，会继续发送FIN包告知客户端关闭关闭连接，之后迁移到Last_ACK状态。但是close_wait过多只能说明没有迁移到Last_ACK，也就是服务端是否发送FIN包，只有发送FIN包才会发生迁移，所以问题定位在是否发送FIN包。FIN包的底层实现其实就是调用socket的close方法，这里的问题出在没有执行close方法。说明服务端socket忙于读写。

4.close_wait过多的解决方案

代码层面做到
第一：使用完socket调用close方法；
第二：socket读控制，当读取的长度为0时（读到结尾），立即close；
第三：如果read返回-1，出现错误，检查error返回码，有三种情况：INTR（被中断，可以继续读取），WOULDBLOCK（表示当前socket_fd文件描述符是非阻塞的，但是现在被阻塞了），AGAIN（表示现在没有数据稍后重新读取）。如果不是AGAIN，立即close
可以设置TCP的连接时长keep_alive_time还有tcp监控连接的频率以及连接没有活动多长时间被迫断开连接

Kuany_

关注

18
点赞
踩
51

收藏

觉得还不错? 一键收藏
1
评论
TCP通信过程中time_wait和close_wait产生过多的原因和解决方法

TCP通信过程中time_wait，和close_wait产生过多的原因和解决方法1. time_wait过多产生原因2.time_wait过多解决方法3.close_wait过多原因4.close_wait过多的解决方案1. time_wait过多产生原因正常的TCP客户端连接在关闭后，会进入一个TIME_WAIT的状态，持续的时间一般在1-4分钟，对于连接数不高的场景，1-4分钟其实并不长，对系统也不会有什么影响，但如果短时间内（例如1s内）进行大量的短连接，则可能出现这样一种情况：客户
复制链接

扫一扫

专栏目录