问题描述
从weblogic控制台上,可以看到连接泄露已经达到了6K+,应用已经变得非常不稳定。
根据以往的经验,连接池出现泄漏情况一般为代码申请了一个数据库连接,使用后未正常关闭,导致连接一致被占用,应用运行长时间后,累积的泄漏连接越来越多,导致应用在申请数据库连接时出现无可用连接的情况,从而出现应用报异常的情况。
排查过程
从PLSQL中 工具 -会话
可以看到 存在的sql,然后对应到了具体的代码中,发现问题。
出现这种情况后,我们可以从数据库查询一下当前sessions和processes配置情况,都在1600以上;
select count (*) from v$session;
select count(*) from v$process;
查询当前占用数据库连接较多的主机和登录用户名
select count(*),SCHEMANAME,machine from v$session group by SCHEMANAME,machine;
(注:截图中的数据不是出现问题时的情况反映)
如果某一主机占用连接数很大,明显不正常,进一步,检查造成这种情况的sql:
select count(*),v.PREV_SQL_ADDR,v.PREV_HASH_VALUE from v$session v group by v.PREV_SQL_ADDR,v.PREV_HASH_VALUE order by count(*) desc ;
查询相关的SQL内容:
select * from v$sql s where s.ADDRESS='C0000013B573D278' and s.HASH_VALUE='32127143';
查询得到语句:
insert into onu_oper_record ( id,order_id , wo_id,oper_type,accnbr,create_time,staff_id,staff_name,area_id,org_id,bccode,crm_ret_code,crm_ret_msg,crm_bcd_code) values ( onu_oper_record_seq.nextval ,:1,:2,:3,:4,:5,:6,:7,:8,:9,:10,:11,:12,:13)
检查发现 java 类中存在两次获得连接未正常关闭的情况
思考
之前排查代码的时候,仅仅考虑了看是否有未关闭的连接,却没有注意到 获取的时候 并没有将获取的连接 赋值给 connecition,导致虽然最后关闭了连接,其实传入的是null。