今天做了个测试socket编程的小程序,竟然碰到几个比较麻烦的问题,现总结下,以儆效尤:
- 单机调试问题
客户端和服务器端程序IP地址均设为“127.0.0.1”,客户端connect()中的地址端口应和服务器端listen()的地址端口一样。然后就是关于客户端bind()的地址端口下面2中详细讲解。 - 自动分配端口问题
由于我的客户端是一个很简单的程序,并没有并发的生成大量的socket连接,所以开始的时候将bind()的地址端口设为一样的,这样就出现了3中提到的TIME_WAIT问题,导致运行一次客户端后,出现errorcode = 10048(地址在使用中)也就是说端口占用。
解决方法:通过bind()中的地址的端口设置为0,这样Windows会自动为每个socket分配一个1024~5000内唯一未被占用的端口 - TIME_WAIT状态问题
下面就是最重要的问题了----TIME_WAIT
TIME_WAIT状态
根据TCP协议定义的4次握手断开连接规定,发起socket主动关闭的一方socket将进入TIME_WAIT状态,TIME_WAIT状态将持续2个MSL(Max Segment Lifetime),在Windows下默认为4分钟,即240秒,TIME_WAIT状态下的socket不能被回收使用. 具体现象是对于一个处理大量短连接的服务器,如果是由服务器主动关闭客户端的连接,将导致服务器端存在大量的处于TIME_WAIT状态的socket,甚至比处于Established状态下的socket多的多,严重影响服务器的处理能力,甚至耗尽可用的socket,停止服务. TIME_WAIT是TCP协议用以保证被重新分配的socket不会受到之前残留的延迟重发报文影响的机制,是必要的逻辑保证.
解决方法:
1.尽量在客户端closesocket(),防止服务器端在存在大量并发的socket连接的时候无响应
2.通过将给socket添加 SO_DONTLINGER 或者 SO_LINGER属性,强制关闭连接,但是这样将可能导致数据丢失
3.通过修改HKEY_LOCAL_MACHINE/SYSTEM/CurrentControlSet/Services/Tcpip/Parameters,添加名为TcpTimedWaitDelay的DWORD键,设置为30-240,以缩短TIME_WAIT的等待时间
通过比较,建议方法1,本人也是这样解决的。