数据库:oracle
有一个流水表,表数据量千万级,一个管理台常用条件分页查询突然变慢,有日期条件且有索引。
部署服务器是多台,数据库查询操作使用Hibernate框架。
逐台服务器sql日志跟踪排查,根据hibernate发出sql语句,在oracle数据库检查对应的执行计划,
使用视图:
v$sql:获取找到sql语句对应的sql_id和plan_hash_value。
再从v$sql_plan根据上面两个条件找到对应的执行计划。
由于hibernate生成sql语句每台机器虽然界面操作查询条件一致,但是每台机器最后生成的sql语句不同(字段从重命名 as带有不通后缀),数据库当做不同的sql语句。走不同执行计划。
最后发现某一台分页统计count语句执行计划没有走索引,进行全表扫描,由于数据量大导致该语句耗时较长导致查询变慢很多。
至于为什么oracle为什么进行全表扫描二不走索引,数据库进行表分析时候人认为走全表快,不是很清除。问题找到了不管了,留给专业人士解决。
===============
问题排查:
逐台查询日志,发现某一台服务器分页count语句和取某页具体数据两个动作之间log日志时差较大。
weblogic日志有 阻塞stackmaxtime 600s线程异常,错误栈已经到oracle socket通信。
数据库查询对应执行计划