先说结论:
执行了如下的命令后,问题解决。 之前nf_conntrack_max的值是65536
sysctl -w net.netfilter.nf_conntrack_max=358576
参考:
Linux服务器丢包故障的解决思路及引申的TCP/IP协议栈理论
http://www.sdnlab.com/17530.html
===================================
问题描述:
当php的请求量稍微变大的时候(nginx+php-fpm的架构),php对外建立连接的时间 connnect 的时间会变长(无论连接mysql,还是redis都很慢),持续几秒钟才建立了解成功,有的时候甚至卡10几秒,30秒,但是本身请求量不是非常大,也就几百次/秒,同时cpu占用非常低(10%不到), time_wait连接数也很少(开启了快速回收),进程能打开的句柄数8192(和打开的fd数量没关系),机器的网络流量也远没有达到瓶颈(实际上这个机器时不限制流量上限的),那么问题出在哪里了?
机器:
12核12G,php-frm 400个进程。
strace php进程看到的一些现象:
// 这个是异常的情况
1476414907.830951 connect(5, {sa_family