最近遇到onvif连接失败问题,发现cgi应用和主进程通信失败。
经过分析,当cgi应用向主进程发送消息的时候,tcp握手失败,客户端发送的最后一个ACK服务器没有收到,导致服务器一直向客户端重发SYN+ACK,客户端也一直重发ACK,但是服务器一直处于RCVD状态不会进入下一状态。
后来发现服务器侦听端口的接收缓存队列不是0,查了下队列满了
tcp 11 0 0.0.0.0:ABCD 0.0.0.0:* LISTEN 1143/XXXX
tcp 0 0 127.0.0.1:ABCD 127.0.0.1:35123 SYN_RECV -
tcp 0 0 127.0.0.1:ABCD 127.0.0.1:35121 SYN_RECV -
tcp 0 0 127.0.0.1:ABCD 127.0.0.1:35122 SYN_RECV -
tcp 0 0 127.0.0.1:ABCD 127.0.0.1:35119 SYN_RECV -
显然服务器处理消息的过程可能被阻塞了,没有返回进行下一次accept和recv。
那么这种情况是否会导致新的连接握手失败呢,又是不是上边发现的情况呢,写个tcp的服务器和客户端测试下
最终发现确实在listen队列满了之后,出现上述情况。
但是具体是哪里阻塞了呢,问题复现比较困难概率较低,路漫漫其修远兮啊。。。