现象
内部提供了一个文件上传的SDK,通过Apache HttpClient访问公司内部的文件服务器进行文件上传,然后偶尔会有同事反馈文件没有上传成功,但是文件服务器这边查看log也并没有收到请求,
比较频繁出现的是,有个小组自己封装了一个导入导出的服务,这个服务会大量频繁的与文件服务打交道,在高峰期的时候,对方导入导出就会大量出现文件无法上传,卡住的情况,查看log就是客户端打印出开始上传,然后线程就没有下文了,
因为sdk没有提供设置connectionTimeout等超时时间的设置,超时时间使用的都是默认的,因此怀疑是长时间没有建立连接在等待着,因此sdk做了一个超时时间的设置,5秒钟,没有建立连接成功就出错,设置过该参数后看到如下结果:
Timeout waiting for connection from pool,从连接池中获取连接超时,这种情况说明connection连接都在被占用着,但是连接总数我们设置在1024个,根据业务量不应该会有这么大的并发以及等待这么久,
由此考虑可能是连接泄露了,没有及时归还到连接池中,因此去查看了一下SDK中使用httpclient上传的代码,可以看见只对用户上传的文件流进行了关闭,但是并没有对httpClient返回的文件流进行关闭,因此出现的问题找到了,我们需要在最后关闭response流相关的资源。
解决方法
在最后对response的文件流进行资源关闭,httpClient就会释放连接。
if (httpResponse != null) {
httpResponse.getEntity().getContent().close();
}
注意点
当文件流(不管是参数传入的文件流,还是http返回的内容流)用完之后一定需要关闭释放连接,发生异常时一定要用httpRequest对象调用abort方法释放连接。