关于这个问题,n年前就遇到了,当时是设备运行半个月一个月网络就中断了,死活连不上。后来在办公室模拟了现场网络不稳定的情况,找到了问题的根源,就是连接一直停留在FIN_WAIT1状态无法超时退出,导致资源占用了,客户端连接不上来。没想到今天新作的项目,也遇到了这个问题,解决办法:
在tcp_slowtmr(void)函数内部,复制FIN_WAIT2的处理程序,改成FIN_WAIT1即可。
/* Check if this PCB has stayed too long in FIN-WAIT-1 */
if (pcb->state == FIN_WAIT_1) {
/* If this PCB is in FIN_WAIT_1 because of SHUT_WR don't let it time out. */
if (pcb->flags & TF_RXCLOSED) {
/* PCB was fully closed (either through close() or SHUT_RDWR):
normal FIN-WAIT timeout handling. */
if ((u32_t)(tcp_ticks - pcb->tmr) >
TCP_FIN_WAIT_TIMEOUT / TCP_SLOW_INTERVAL) {
++pcb_remove;
LWIP_DEBUGF(TCP_DEBUG, ("tcp_slowtmr: removing pcb stuck in FIN-WAIT-1\n"));
}
}
}
以上,做个记录,以免以后遇到类似问题卡住了 。
ps:不太理解为什么LWIP有这么大的bug,或者还是我应用层使用出问题了,欢迎了解的朋友指点一下。