in与exists的取舍

最新推荐文章于 2024-01-21 10:35:03 发布

莫特@

最新推荐文章于 2024-01-21 10:35:03 发布

阅读量408

点赞数

分类专栏： Mysql

本文链接：https://blog.csdn.net/dreamwbt/article/details/53363497

版权

Mysql 专栏收录该内容

34 篇文章 0 订阅

订阅专栏

/* in是对内外表的hash连接，exist是对子查询的循环扫描，子查询可能会有相应的索引，不管是exist还是in，外表都是一个外循环，在SQL执行过程中子查询的结果一般是固定的，因此数据库会对子查询结果进行缓存。
*
* 有一种说法：【外大内小用in，内大外小用exist，内外相当则随意】。
* <前提>hash表底层用的是数组，所以hash表内存连续，索引起来相当快，并且计算机在读存储的时候是按照页进行的，这样就避免了多次的读盘操作。hash表相当于存储中数据的元数据
* 《解释》：外小内大的时候，外循环次数相对较少，此时对子查询结果建立hash表需要一定的时间，虽然hash表带来了索引上的高效，而这些时间相对于少量的外循环则显得特别浪费。
* 如果采用exist的话，少量的外循环只需要对内表进行少量的索引（B_tree）
* 外大内小的时候，外部循环次数相对于内表则相当的多，此时内表的hash计算所用的时间相对于外表的循环来说就比较划算，而且hash表的索引速度相当的快
* 内外表相当的时候，两者的差距就只是体现在hash索引的命中和B-tree的命中上，而这两者的优劣并不是一成不变的
*/

/*
* in是把外表和内表作hash
* 连接，而exists是对外表作loop循环，每次loop循环再对内表进行查询。一直以来认为exists比in效率高的说法是不准确的。
* 如果查询的两个表大小相当，那么用in和exists差别不大。如果两个表中一个较小，一个是大表，则子查询表大的用exists，子查询表小的用in：
* 例如：表A（小表），表B（大表）1：select * from A where cc in (select cc from B)
* 效率低，用到了A表上cc列的索引；select * from A where exists(select cc from B where cc=A.cc)
* 效率高，用到了B表上cc列的索引。相反的2：select * from B where cc in (select cc from A)
* 效率高，用到了B表上cc列的索引；select * from B where exists(select cc from A where cc=B.cc)
* 效率低，用到了A表上cc列的索引。 not in 和not exists 如果查询语句使用了not in 那么内外表都进行全表扫描，没有用到索引；而not
* extsts 的子查询依然能用到表上的索引。所以无论那个表大，用not exists都比not in要快。 in 与 =的区别 select name
* from student where name in ('zhang','wang','li','zhao'); 与 select name from
* student where name='zhang' or name='li' or name='wang' or name='zhao'
* 的结果是相同的。
*/

莫特@

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
in与exists的取舍

/* in是对内外表的hash连接，exist是对子查询的循环扫描，子查询可能会有相应的索引，不管是exist还是in，外表都是一个外循环，在SQL执行过程中子查询的结果一般是固定的，因此数据库会对子查询结果进行缓存。 * * 有一种说法：【外大内小用in，内大外小用exist，内外相当则随意】。 * hash表底层用的是数组，所以hash表内存连续，索引起来相当快，并且计算机在读存
复制链接

扫一扫

专栏目录