The last packet successfully received from the server was 1,266,537 milliseconds ago. The last pack

最近接手一个项目,由于该项目对mysql数据库使用频率不是很高,线上每天都会报几十条数据库连接失效的错误信息,刚开始没空处理这个错误,连接失效超时后会继续建立有效连接,不会影响正常的业务。今天抽空处理下这个错误,简单做下总结:

1、线上错误的日志信息如下:

2019-02-23 09:49:35:872 d.s.Statement 149 [ERROR] {conn-10345, stmt-42475} execute error. SELECT 'x'
 com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure

The last packet successfully received from the server was 1,266,528 milliseconds ago.  The last packet sent successfully to the server was 1,266,529 milliseconds ago.
    at sun.reflect.GeneratedConstructorAccessor69.newInstance(Unknown Source)
    at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
    at java.lang.reflect.Constructor.newInstance(Constructor.java:423)
    at com.mysql.jdbc.Util.handleNewInstance(Util.java:404)
    at com.mysql.jdbc.SQLError.createCommunicationsException(SQLError.java:981)
    at com.mysql.jdbc.MysqlIO.send(MysqlIO.java:3652)

2、错误分析

      分析该错误是由于业务系统使用了过期的数据库连接导致请求超时,和dba确认线上mysql数据库wait_timeout配置的3600s(1小时)、业务线程闲置状态下和数据库保持的连接存活1个小时后数据库主动断开连接,这个时候有新的数据库操作请求、拿到该连接去执行validationQuery检测连接是否有效,由于数据库已经主动断开连接、执行检测sql就会抛出上面的错误。问题的本质还是druid线程池里没有及时清除无效的数据库连接导致。

3、解决办法

  3.1、先分析下目前代码线上的druid参数配置如下:

<bean id="dataSourceTemplate" class="com.alibaba.druid.pool.DruidDataSource" abstract="true" init-method="init"
          destroy-method="close">
        <!-- 配置初始化大小、最小、最大 -->
        <property name="initialSize" value="3"/>
        <property name="minIdle" value="10"/>
        <property name="maxActive" value="20"/>
        <!-- 配置获取连接等待超时的时间 -->
        <property name="maxWait" value="60000"/>
        <!-- 配置间隔多久才进行一次检测,检测需要关闭的空闲连接,单位是毫秒 -->
        <property name="timeBetweenEvictionRunsMillis" value="60000"/>
        <!-- 配置一个连接在池中最小生存的时间,单位是毫秒 -->
        <property name="minEvictableIdleTimeMillis" value="300000"/>
        <!--连接最大存活时间,默认是-1(不限制物理连接时间),从创建连接开始计算,如果超过该时间,则会被清理-->
        <property name="phyTimeoutMillis" value="1500000"/>
        <property name="validationQuery" value="SELECT 'x'"/>
        <property name="testWhileIdle" value="true"/>
        <property name="testOnBorrow" value="false"/>
        <property name="testOnReturn" value="false"/>

        <!-- 打开removeAbandoned功能 -->
        <property name="removeAbandoned" value="true"/>
        <!-- 1800秒,也就是30分钟 -->
        <property name="removeAbandonedTimeout" value="1800"/>
        <!-- 关闭abanded连接时输出错误日志 -->
        <property name="logAbandoned" value="true"/>
        <property name="proxyFilters">
            <list>
                <bean class="com.alibaba.druid.filter.logging.Slf4jLogFilter"/>
                <bean class="com.alibaba.druid.filter.stat.StatFilter">
                    <property name="logSlowSql" value="true"/>
                    <property name="slowSqlMillis" value="5000"/>
                </bean>
            </list>
        </property>
        <property name="filters" value="stat,config,wall"/>
        <property name="connectionProperties"
                  value="config.decrypt=true;druid.log.conn=false;druid.log.stmt=false;druid.log.rs=false;druid.log.stmt.executableSql=true;"/>

    </bean>

各个参数的意思不用多说,官网都有详细解释,不明白的自行去搜索。

3.2、看下druid的源码关于线程池连接失效处理逻辑、对应的是com.alibaba.druid.pool.DruidDataSource类下面shrink(boolean checkTime)方法、源码如下:

public void shrink(boolean checkTime) {
        ArrayList evictList = new ArrayList();

        try {
            this.lock.lockInterruptibly();
        } catch (InterruptedException var13) {
            return;
        }

        try {
            // 线程池里的线程总数 - 核心线程池数(上面配置的是10)
            int checkCount = this.poolingCount - this.minIdle;
            long currentTimeMillis = System.currentTimeMillis();

            int i;
            for(i = 0; i < this.poolingCount; ++i) {
                DruidConnectionHolder connection = this.connections[i];
                if (checkTime) {
                    long idleMillis;
                    if (this.phyTimeoutMillis > 0L) {
                        // 当前时间 - 线程的创建时间、大于配置的phyTimeoutMillis(上面配置的1800s)直接强制回收
                        idleMillis = currentTimeMillis - connection.getTimeMillis();
                        if (idleMillis > this.phyTimeoutMillis) {
                            evictList.add(connection);
                            continue;
                        }
                    }

                    idleMillis = currentTimeMillis - connection.getLastActiveTimeMillis();
                    //线程闲置时间小于 最小存活时间(上面配置的300s)直接跳出判断
                    if (idleMillis < this.minEvictableIdleTimeMillis) {
                        break;
                    }
                    //当前线程池数量超过核心线程数(上面配置的10)直接回收掉多余的线程
                    if (checkTime && i < checkCount) {
                        evictList.add(connection);
                    // 闲置时间超过最大存活时间直接清除(上面没有配置 默认)
                    } else if (idleMillis > this.maxEvictableIdleTimeMillis) {
                        evictList.add(connection);
                    }
                } else {
                    if (i >= checkCount) {
                        break;
                    }

                    evictList.add(connection);
                }
            }

            i = evictList.size();
            if (i > 0) {
                System.arraycopy(this.connections, i, this.connections, 0, this.poolingCount - i);
                Arrays.fill(this.connections, this.poolingCount - i, this.poolingCount, (Object)null);
                this.poolingCount -= i;
            }
        } finally {
            this.lock.unlock();
        }

        Iterator var15 = evictList.iterator();

        while(var15.hasNext()) {
            DruidConnectionHolder item = (DruidConnectionHolder)var15.next();
            Connection connection = item.getConnection();
            JdbcUtils.close(connection);
            this.destroyCount.incrementAndGet();
        }

    }

3.3、可以很直观的看到是由于phyTimeoutMillis配置的时间太大(这种是根据线程时间强制回收连接、对系统不是很友好、将参数值调小也能解决问题)、或者添加如下配置来及时清除无效的连接、个人比较推荐这种方式

        <!-- 线上配置的mysql断开闲置连接时间为1小时,数据源配置回收时间为3分钟,以最后一次活跃时间开始算  -->
        <property name="maxEvictableIdleTimeMillis" value="180000"/>

3.4、最终调整过后的线上配置如下所示、问题解决:

 <bean id="dataSourceTemplate" class="com.alibaba.druid.pool.DruidDataSource" abstract="true" init-method="init"
          destroy-method="close">
        <!-- 配置初始化大小、最小、最大 -->
        <property name="initialSize" value="3"/>
        <property name="minIdle" value="10"/>
        <property name="maxActive" value="20"/>
        <!-- 配置获取连接等待超时的时间 -->
        <property name="maxWait" value="60000"/>
        <!-- 配置间隔多久才进行一次检测,检测需要关闭的空闲连接,单位是毫秒 -->
        <property name="timeBetweenEvictionRunsMillis" value="60000"/>
        <!-- 配置一个连接在池中最小生存的时间,单位是毫秒 超过这个时间每次会回收默认3个连接-->
        <property name="minEvictableIdleTimeMillis" value="30000"/>
        <!-- 线上配置的mysql断开闲置连接时间为1小时,数据源配置回收时间为3分钟,以最后一次活跃时间开始算  -->
        <property name="maxEvictableIdleTimeMillis" value="180000"/>
        <!--连接最大存活时间,默认是-1(不限制物理连接时间),从创建连接开始计算,如果超过该时间,则会被清理-->
        <property name="phyTimeoutMillis" value="15000"/>
        <property name="validationQuery" value="SELECT 'x'"/>
        <!--建议配置为true,不影响性能,并且保证安全性。申请连接的时候检测,如果空闲时间大于timeBetweenEvictionRunsMillis,执行validationQuery检测连接是否有效。-->
        <property name="testWhileIdle" value="true"/>
        <!--申请连接时执行validationQuery检测连接是否有效,做了这个配置会降低性能。-->
        <property name="testOnBorrow" value="false"/>
        <property name="testOnReturn" value="false"/>

        <!-- 打开removeAbandoned功能 设置一个连接的租期,如果超过removeAbandonedTimeout时间直接清除连接-->
        <property name="removeAbandoned" value="true"/>
        <!-- 1800秒,也就是30分钟 -->
        <property name="removeAbandonedTimeout" value="1800"/>
        <!-- 关闭abanded连接时输出错误日志 -->
        <property name="logAbandoned" value="true"/>

        <property name="proxyFilters">
            <list>
                <bean class="com.alibaba.druid.filter.logging.Slf4jLogFilter"/>
                <bean class="com.alibaba.druid.filter.stat.StatFilter">
                    <property name="logSlowSql" value="true"/>
                    <property name="slowSqlMillis" value="5000"/>
                </bean>
            </list>
        </property>
        <!--配置监控统计拦截的filters,去掉后监控界面sql无法统计,'wall'用于防火墙-->
        <property name="filters" value="config"/>

        <!--配置连接的一些属性、config.decrypt=true 表示提供的密码是加密过的-->
        <property name="connectionProperties"
                  value="config.decrypt=true;druid.log.conn=false;druid.log.stmt=false;druid.log.rs=false;druid.log.stmt.executableSql=true;"/>

    </bean>

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值