in与exists的取舍

/* in是对内外表的hash连接,exist是对子查询的循环扫描,子查询可能会有相应的索引,不管是exist还是in,外表都是一个外循环,在SQL执行过程中子查询的结果一般是固定的,因此数据库会对子查询结果进行缓存。
 * 
 * 有一种说法:【外大内小用in,内大外小用exist,内外相当则随意】。
 * <前提>hash表底层用的是数组,所以hash表内存连续,索引起来相当快,并且计算机在读存储的时候是按照页进行的,这样就避免了多次的读盘操作。hash表相当于存储中数据的元数据
 * 《解释》: 外小内大的时候,外循环次数相对较少,此时对子查询结果建立hash表需要一定的时间,虽然hash表带来了索引上的高效,而这些时间相对于少量的外循环则显得特别浪费。
 * 如果采用exist的话,少量的外循环只需要对内表进行少量的索引(B_tree)
 * 外大内小的时候,外部循环次数相对于内表则相当的多,此时内表的hash计算所用的时间相对于外表的循环来说就比较划算,而且hash表的索引速度相当的快
 * 内外表相当的时候,两者的差距就只是体现在hash索引的命中和B-tree的命中上,而这两者的优劣并不是一成不变的
 */


/*
 * in是把外表和内表作hash
 * 连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询。一直以来认为exists比in效率高的说法是不准确的。
 * 如果查询的两个表大小相当,那么用in和exists差别不大。 如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in:
 * 例如:表A(小表),表B(大表)1:select * from A where cc in (select cc from B)
 * 效率低,用到了A表上cc列的索引;select * from A where exists(select cc from B where cc=A.cc)
 * 效率高,用到了B表上cc列的索引。 相反的2:select * from B where cc in (select cc from A)
 * 效率高,用到了B表上cc列的索引;select * from B where exists(select cc from A where cc=B.cc)
 * 效率低,用到了A表上cc列的索引。 not in 和not exists 如果查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;而not
 * extsts 的子查询依然能用到表上的索引。所以无论那个表大,用not exists都比not in要快。 in 与 =的区别 select name
 * from student where name in ('zhang','wang','li','zhao'); 与 select name from
 * student where name='zhang' or name='li' or name='wang' or name='zhao'
 * 的结果是相同的。
 */
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值