Oracle count很慢
事故描述
在执行一条分页查询的sql时,select *
的结果只需要150ms左右,正常select count(1)
也只需要100ms左右。
但当where条件中含有某一个参数时会导致select count(1) 的速度非常慢,需要140s以上;select *
响应速度正常。且仅在生产环境会出现该问题,测试环境select count(1)
仍然只需要100ms左右。
该问题导致了页面会卡死,若反复执行带有该参数的sql会导致当前节点不可用,k8s重启该pod。
事故分析
刚开始认为是因为该字段是嵌套查询的结果导致的,也可能是因为使用了函数导致的,但很快被推翻了,因为在测试环境响应速度正常。
事故产生原因到最后也没有一个明确的结果,但有解决方案。
解决方案
其实这个解决方案在网上很难查到,我们并没有从网上得到一个明确的结果,但受到了一篇博客的启发,该博客中指出rownum
的结果和实际的结果数量不一致,由于我的数据库表的 num_rows 统计分析的是 7250,但是实际只有 2450 行数据。
这引发了我们对rownum的思考,认为rownum可能会对count起到帮助作用。最后我们在select count(1)
中加入了rownum
,响应时间恢复正常。