人生第一篇博客,希望能以一个好的开始,持之以恒下去!
这两天在做有关负载均衡的一个项目,期间在调试时遇到了一个问题:客户端与服务端依靠socket通信,但是长时间通信后,会发生客户端连接不上服务端的状况。而后查询了一些资料后,终于搞清楚问题的缘由了,在此和大家分享一下!
调试时的环境是:一个客户端,有多个服务端,那么客户端去连接哪个服务端是由负载均衡算法计算出来的,将众多server中负载最小的一个server的IP地址返回给客户端,而后client再去连接那台最优的server。
直接点说,问题的原因是客户端短时间内大批量的连接服务端后,系统没有多余的端口为后续的连接使用了。
当客户端与服务端通信时,系统会分配给客户端一个端口,但是在用户调用closesocket()之后,这些端口并不会close掉,而是处于TIME_WAIT状态。而TIME_WAIT状态的端口是无法被下面的连接使用的,而TIME_WAIT状态并不会一直持续下去,它会持续2个MSL时间,4分钟。这也就是客户端为什么在短时间内大批量的与服务端通信后,会连不上server端。
端口的TIME_WAIT状态,是TCP连接断开时肯定会出现的状态,是协议自我保护的一部分,我们