exist与in的区别

目录

一.先说结论

二.原理

1.使用b表的100条数据循环与a表的1000000条数据去匹配,需要匹配100次a表

2.使用a表的1000000条数据循环与b表的100条数据去匹配,需要匹配1000000次b表

三.最后总结


一.先说结论

当B表的数据集小于A表数据集时,用in优于exists。

select id from A where id in (select id from B)

当A表的数据集小于B表的数据集时,用exists优于in。

select id from A where exists (select id from B where A.id = B.id)

可以这么理解:in后面跟的是小表,exists后面跟的是大表

select * from A where id in (select id from B)

也可以写成

select id from B bleft joinselect id from A a where a.id = b.id

二.原理

首先,我们需要了解数据库的小表驱动大表。

假设 a表1000000数据,b表100数据,这里有两个过程,b 表数据最少,查询引擎优化选择b为驱动表,循环b表的100条数据,跟a表的1000000数据去匹配,这个匹配的过程是B+树的查找过程,比循环取数要快的多。

已知:数据库存储结构用的B+树形结构,时间复杂度为O(logN),表数量越大,越趋近于一个固定值。

1.使用b表的100条数据循环与a表的1000000条数据去匹配,需要匹配100次a表

由于a表数据较多,所以将趋近于一个具体值,假设复杂度具体值为10,则b表查询100次的复杂度为1000;

2.使用a表的1000000条数据循环与b表的100条数据去匹配,需要匹配1000000次b表

由于b表数据较少,所以会是一个上升状态的值,假设复杂度具体值为1,则a表查询1000000次的复杂度为1000000;

可以通过简单的例子看的出来,小表驱动大表的重要性。

需要注意的是a表字段id和b表字段id 都要建立索引。

三.最后总结

小表驱动大表,in后面跟的是小表,exists后面跟的是大表。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值