最近运维反馈说某个站的redis占用了大量的TCP端口,状态全部为TIME_WAIT,如果压力再涨可能会爆掉。
由于采用的是短连接,第一反应是代码是否没有做close。一查代码果然没有close,立马加上看效果,依然如此。
经过多次查证确认已将所有该加的地方都加上,此时怀疑close是否无效,故做简单测试:循环10万次,只建立连接,建立之后马上close。结果依然爆掉,当TCP涨到56520就报错,连接不上。由此看来close 对 TIME_WAIT完全没影响。测试mysql得到的结果一样,因此,应用端的close并不能解决TIME_WAIT。上网找一圈,发现讨论这个问题都说是没有close,所有人都是以讹传讹!测试一下能有多难?
查看TIME_WAIT状态
netstat -na | grep 3679
解决方法有2个:
1.改用长连接,即pconnect,修改后TCP的连接最大值与PHP的进程数一致,不会持续涨,但该连接永远不会回收。
2.修改系统配置
vi /etc/sysctl.conf