公司的网站经常发生下面问题:
发生了下列的错误:
- Connection Failed
连接失败
系统返回以下内容:
(110) Connection timed out
系统使用HttpClient发送报文(会有循环发送情况)到外部系统通过nginx分发,这时nginx会报出 connect failed (110- Connection timed out) 错误( 有一些请求报错,有一些不报,都是不定的 ),在网络中查到的答案大部分都说是因为系统内核错误,因为Nginx调用了gettimeofday()方法,但是我们通过编写C代码调用gettimeofday()方法进行测试,根本无法重现这个BUG,所以想到会不会是因为系统内部的错误。
经过调查发现我们在使用HttpClient发送报文之后 没有关闭连接 ,添加代码:
httpclient = new DefaultHttpClient(new ThreadSafeClientConnManager());
finally { if (httpclient != null && httppost != null){ // 释放连接资源 httppost.releaseConnection(); // 关闭Socket连接 httpclient.getConnectionManager().shutdown(); } }
然后再经过一天一夜的测试发现没有再出现connect failed (110- Connection timed out)这个问题了。
再说一下出现这个问题的猜测:
系统内部( 我们系统有定时器和主动发送 )一直再创建新的httpclient连接并且没有关闭这个连接,一旦出现大量发送报文会导致 系统与Nginx之间的等待的连接过多 ,这样会导致nginx分发出现问题,从而导致nginx报出Connection timed out,因为连接太多了,没有释放,而nginx主动释放连接是有时间的。