一直以来用都是Oracle数据库,DBA告诫我们说,能用exists就不要用in
最近的项目中使用Mysql,也一直遵照这个理论,但是在压力测试时就发现了问题,很多SQL执行奇慢无比,表的数据量接近百万。
各种Google,查询效率分析,添加索引都不能满足时效要求。
各种分析之后得出结论如下:
mysql中的in语句是把外表和内表作hash 连接,而exists语句是对外表作loop循环,每次loop循环再对内表进行查询。
如果查询的两个表大小相当,那么用in和exists差别不大。
如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in
顺便吐槽一下,最近看到的最恶心的SQL语句,sql如下
select * from (select * from A,B,C where A.id=b.A_id and b.id= c.B_id) A where id=?
当数据量稍微有点规模的时候,就是让人疯狂的时候,如果一定要这么写,就不能把条件放到里面!!!
mysql慢查询一般都是这个