所用nginx版本为1.2.0,现在看有点老了,新版本已经有很多改进,后面会提到。
问题场景就是上篇blog中最后提到的:nginx收到client的请求,然后连接一个up-server(这里是一个tomcat),并将请求发给它,tomcat产生数据,返回给nginx;但此时由于nginx任务过重,没能及时读取数据,导致tcp接收缓冲满了,tcp窗口长时间为0;tomcat的写请求最终超时,这时tomcat直接发一个RST断开tcp;稍后的时间里,nginx去读取tcp接收缓冲中的数据,并转发给client,读到最后时返回n=-1、errno=ECONNRESET;但nginx却并未在意这个错误,nginx与client的tcp连接仍然存在,直到写超时,nginx才主动关闭该连接,致使client白等了老长时间。
其实问题并不复杂,调一遍代码基本就能摸清楚流程。这里正好借这个问题,看看RST的相关处理。
1.RST的产生
RST总的来说就是异常关闭,与其对立的就是FIN的正常关闭。tcp连接中有多种情况会产生RST,如被访问端口未listen,close的套接字(非shutdown的)收到数据,读缓冲区还有数据时提前close,