投稿作者:一位架构师朋友,文末有他公众号
一、问题
今天有个小伙伴跑过来告诉我有个奇怪的问题需要协助下,问题确实也很奇怪。客户端调用RT比较高并伴随着间歇性异常Connection reset出现,而服务端CPU 、线程栈等看起来貌似都很正常,而且服务端的RT很短。
这里先说下结果:因为TCP全连接队列太小导致的连接被丢弃,因为项目使用Spring Boot 内置的Tomcat,而默认accept-count是100,而这个参数在这里就代表了全连接队列大小。所以在请求波峰的时候全连接队列被打满导致有连接丢弃。所以我们调整server.tomcat.accept-count这个参数解决了问题。
二、半连接队列和全连接队列
好了为了知其然知其所以然,从异常信息来看可能是TCP连接出现了什么问题,其中重点就是半连接队列和全连接队列。下面就来看看什么是TCP 半连接队列和全连接队列,其为什么会出现这种奇怪的现象。
1、TCP 三次握手流程和队列
TCP三次握手时,Linux内核会维护两个队列:
1、半连接队列,被称为SYN队列
2、全连接队列,被称为 accept队列
老生常谈,还要从大家都熟悉TCP三次握手说起,来看一张图: