参考:https://blog.csdn.net/wangyangzhizhou/article/details/52209336
druid 连接池配置信息解析:https://www.cnblogs.com/halberd-lee/p/11304790.html
问题出现原因浮现:
在项目中多线程跑定时任务操作数据库时,对后台服务进行了重启,重启后定时任务重新跑时出现大量的CLOSE_WAIT 状态的日志,说明套接字是被动关闭的!(被数据库关闭的)
因为如果是web 端主动断掉当前连接的话,那么双方关闭这个TCP连接共需要四个packet:
TCP连接关闭的状态图:
TCP 状态图:
查看系统网络连接:
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
LAST_ACK 1
SYN_RECV 15
CLOSE_WAIT 7729
ESTABLISHED 471
FIN_WAIT1 3
FIN_WAIT2 52
SYN_SENT 1
TIME_WAIT 725
如果这些连接超时失效了,连接池为什么还会获取这些失效的连接呢。
这个和druid 连接池的某些配置有关系:
testOnBorrow=false
由于我们不检测池里连接的可用性,于是假如连接池中的连接被数据库关闭了,应用通过连接池getConnection 时,都可能获取到这些不可用的连接,且这些连接如果
不被其他线程回收的话,它们不会被连接池删除,也不会重新被创建,占用了连接池的名额。
当testOnBorrow=true 时,有两种情况:
1.当服务重启时,如果连接刚好不处于通信阶段,TCP连接正处于CLOSE_WAIT 状态或已关闭,当应用通过连接池getConnection时,在borrow 时会检测连接,由于连接已关闭,于是报了如下错误,并重新建立连接,此时新连接,连接到应用上。后面就可以正常通信了。
com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure
The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server.
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
Caused by: java.io.EOFException: Can not read response from server. Expected to read 4 bytes, read 0 bytes before connection was unexpectedly lost.
at com.mysql.jdbc.MysqlIO.readFully(MysqlIO.java:3143)
at com.mysql.jdbc.MysqlIO.readPacket(MysqlIO.java:597)
... 21 more
② 应用实例宕掉时,如果连接刚好处于通信阶段,由于客户端无法立即感知服务端已断连接,它可能会报如下错误,等待服务端的响应超时报错。当应用通过
连接池getConnection时,在borrow时会检测连接,由于连接已关闭,于是报了如下错误,并重新建立新连接,此时新连接到应用上。通信正常
com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure
The last packet successfully received from the server was 10,538 milliseconds ago. The last packet sent successfully to the server was 10,306 milliseconds ago.
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
Caused by: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure
为了避免获取到的连接是不能用的连接,所以应该增加一些配置:
testWhileIdle=true # 申请连接的时候检测,如果空闲时间大于timeBetweenEvictionRunsMillis,执行validationQuery检测连接是否有效
timeBetweenEvictionRunsMillis=180000 # 1) Destroy线程会检测连接的间隔时间 2) testWhileIdle的判断依据,详细看testWhileIdle属性的说明
validationQuery=select 1 #用来检测连接是否有效的sql 如果validationQuery为null,testOnBorrow、testOnReturn、testWhileIdle都不会起作用
testOnBorrow=true # 申请连接时执行validationQuery检测连接是否有效,做了这个配置会降低性能。
testOnReturn=true # 归还连接时执行validationQuery检测连接是否有效,做了这个配置会降低性能(可以不开启)