服务器出现大量TIME_WAIT状态怎么解决

1. TIME_WAIT产生的原因
1.1 四次挥手

image

  1. 假设主动关闭连接的一方为A,被动关闭连接的一方为B
  2. A调用close();协议层发送FIN包
  3. B收到FIN包后,回复ACK,进入CLOSE_WAIT状态,A等待对方关闭,进入FIN_WAIT_2状态,此时,A会等待B的应用程序调用close操作
  4. B在完成所有数据发送后,调用close()操作;此时,协议层会发送FIN包给A,然后等待对方的ACK,进入LAST_ACK状态;
  5. A收到FIN包,回复ACK,进入TIME_WAIT状态;B收到ACK后,进入CLOSED状态; 如果B没有受到ACK,那么将再次发送FIN包给A,确保连接关闭的可靠性
  6. 等待2MSL时间,主动关闭的一方,结束TIME_WAIT,进入CLOSED状态;如果在此期间收到了新的FIN,那么会在回复ACK之后,重新等待2MSL

MSL(Maximum Segment Lifetime,“报文最大生存时间”),他表示任何报文在网络上存在的最长时间,超过这个时间报文将被丢弃。
TTL(time to live,“生存时间”),存储了一个ip数据报可以经过的最大路由数,每经过一个处理他的路由器此值就减1,当此值为0则数据报将被丢弃,同时发送ICMP报文通知源主机。
在 RFC 793中规定MSL为2分钟,linux中默认为30秒。

1.2 TIME_WAIT有什么用呢?

如果没有TIME_WAIT这个状态,主动方直接关闭连接的时候。 两种情况下,处理会出问题。

  1. 如果A和B又重新建立链接,而这个时候B上次连接没有收到A的ack,导致重传的fin过来了,这将影响新的连接。
  2. AB之间没有新连接,B没有收到A的ack,导致重传的fin过来了,A会给B发一个RST包,可能会影响B其它的服务连接。
2. TIME_WAIT造成的危害
2.1 消耗资源

为释放的socket会占用内存、CPU、文件描述符数量等等,还有一个时端口数量,在一个连接没有进入CLOSED状态之前,这个连接是不能被重用的!除非设置了端口重用。

3. 解决办法
3.1 修改内核参数
net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。

net.ipv4.tcp_tw_reuse启用时,当主动关闭连接的一方,再次向对方发起连接请求的时候,可以复用TIME_WAIT状态的连接。 系统根据时间戳判断是否是延迟的数据,如果是,则丢弃。
net.ipv4.tcp_tw_recycle启用时,回收时间不再是2msl而是一个RTO(retransmission timeout,数据包重传的timeout时间),远小于2msl,约0.7s。

3.2 不主动关闭socket

不主动关闭socket,就不会产生TIME_WAIT状态

3.3 短链接改长连接

长连接从根本上减少了关闭连接的次数,减少了TIME_WAIT状态的产生数量,在高并发的系统中非常有效

参考:
[1] TCPIP详解 卷1:协议
[2] https://blog.csdn.net/weixin_39590058/article/details/105681569
[3] https://blog.csdn.net/fanren224/article/details/89849276
[4] https://www.jianshu.com/p/cd801d1b3147
[5] 《unix网络编程》

服务器出现大量time_wait是指在TCP连接断开后,服务器端口仍处于等待状态的情况。这可能会导致服务器资源的浪费,影响服务器的性能和可用性。以下是理解并解决这个问题的步骤: 首先,需要理解time_wait的原因:TCP连接的断开是一个多步骤的过程,在最后一个ACK报文发送后,服务器端口会进入time_wait状态一段时间,以确保在这段时间内没有延迟的报文重新出现。这是网络协议设计的一部分,用于确保数据传输的可靠性。 为了解决服务器出现大量time_wait的问题,可以采取以下措施: 1. 调整服务器参数:可以通过修改服务器操作系统的参数来调整time_wait状态的时间。例如,可以减少time_wait状态的持续时间,以释放服务器资源。具体的操作方法可以参考操作系统的文档或相关文档。 2. 加大服务器资源:如果服务器出现大量time_wait的问题,可能是服务器的资源(例如端口号)不足造成的。此时,可以考虑增加服务器的资源,例如扩大服务器的端口范围等。 3. 优化应用程序代码:服务器出现大量time_wait可能是应用程序代码设计不佳造成的。在应用程序中,可以优化代码,以减少TCP连接的数量和时间。例如,可以使用连接池来重用连接,或者调整连接关闭的时机。 4. 负载均衡和故障转移:如果服务器经常出现大量time_wait,可能是由于服务器负载过高或单点故障引起的。此时,可以考虑使用负载均衡和故障转移技术来分散流量和提高服务器的可用性,从而减少time_wait的数量。 总之,彻底理解并解决服务器出现大量time_wait的问题需要对网络协议、服务器参数和应用程序代码等方面有一定的了解。通过调整参数、加大服务器资源、优化代码以及使用负载均衡和故障转移等技术,可以有效地减少time_wait的数量,提高服务器的性能和可靠性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值