Sql中为什么要小表驱动大表，以及In以及exists的使用对比

最新推荐文章于 2024-04-10 09:35:29 发布

技术无产者

最新推荐文章于 2024-04-10 09:35:29 发布

阅读量3.4k

点赞数 3

分类专栏：数据库文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39552268/article/details/111961963

版权

数据库专栏收录该内容

19 篇文章 0 订阅

订阅专栏

一.分析

mysql的join实现原理是，以驱动表的数据为基础，“嵌套循环”去被驱动表匹配记录，

这里的小表驱动大表速度快的前提是：两个表上根据主/外键建立了索引，这样在根据某一条数据查找B+树时，速度就会大大提高，若没有建立索引，则两个表无论谁当作主表，查找数据的次数都是一样的

select * from a join b on a.bid =b.id

假设 a表10000数据，b表20数据

这里有2个过程，b 表数据最少，查询引擎优化选择b为驱动表，

循环b表的20条数据，
去a表的10000数据去匹配，这个匹配的过程是B+树的查找过程，比循环取数要快的多。

小表驱动的方式

for  20条数据
   匹配10000数据（根据on a.bid=b.id的连接条件，进行B+树查找）

查找次数 20+ log10000

2.如果使用大表驱动，则查找过程是这样的

for 10000条数据
    匹配20条数据（根据on a.bid=b.id的连接条件，进行B+树查找）

查找次数 10000+ log20

二.结论

可以看出来
小表驱动大表：20+ log10000
大表驱动小表：10000+ log20
显然小表驱动大表查询效率要高很多。

C.小表驱动大表的案例：

三.in和exists的对比:

下面关于大表和小表的讨论均为A是小表

a.小表放到in之后的效率优于放到in之前
例：select name from B where id in(select id in A);
分析：

1>IN的语法理解：MySql 的执行顺序会先执行子查询，再执行主查询，然后获得我们要查询的数据。

2>上面的查询语句可以拆成首先 select id in A; 其次 select name from B where B.id=A.id;

b.exists
例：select name from A where exists (Select * from B where B.id=A.id);
分析：

1>将EXISTS 语法理解为：将主查询的数据放在子查询中做条件验证，根据结果TRUE 和 FALSE 来决定主查询中的数据是否需要保留,EXISTS 子查询只返回TRUE 或 FALSE .Exists就是将主查询出的每一条语句放到exists后的子查询中存在即保留。exists/no exists具体用法可看：https://blog.csdn.net/qq_39552268/article/details/111934416

2>先遍历小表A，取得A中每个值和B中的值进行比对，如果比对成功了返回true

总之，什么时候用In,什么时候用exists呢？

1>根据两个表的数据量判断：

我们使用IN 优于 EXISTS。当A表中数据多于 B表中的数据时(我们这里只是假设)，这时我们使用EXISTS 优于 IN。因此是使用IN 还是使用EXISTS 就需要根据我们的需求决定了。但是如果两张表中的数据量差不多时那么是使用IN 还是使用 EXISTS 差别不大。

2>根据限制条件来判断：

虽然exists和in都有过滤功能,他俩最大的差别就是in引导的子句只能对一个字段进行限制,比如

但是如果我们想对多个字段进行限制,使用in就不合适了。具体可参考：https://blog.csdn.net/qq_39552268/article/details/111934416

技术无产者

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
Sql中为什么要小表驱动大表，以及In以及exists的使用对比

分析mysql的join实现原理是，以驱动表的数据为基础，“嵌套循环”去被驱动表匹配记录，select * from a join b on a.bid =b.id假设 a表10000数据，b表20数据这里有2个过程，b 表数据最少，查询引擎优化选择b为驱动表，循环b表的20条数据，去a表的10000数据去匹配，这个匹配的过程是B+树的查找过程，比循环取数要快的多。小表驱动的方式for 20条数据匹配10000数据（根据on a.bid=b.id的连接条件，进行B+树
复制链接

扫一扫

专栏目录

技术无产者

博客等级

码龄7年

139
原创

303
点赞

1254
收藏

3148
粉丝

关注

私信

分类专栏

技术学习 1篇
DDD 2篇
源码分析 11篇
jvm 3篇
开源项目 7篇
深入理解多线程 10篇
项目 21篇
分布式 5篇
MOP问题 5篇
.Net 1篇
大数据 4篇
HADOOP 9篇
Linux 5篇
Hive 1篇
机器学习 3篇
java学习 49篇
设计模式 4篇
考研 3篇
数据库 19篇
算法 2篇
动态规划 3篇
bfs 1篇
Hash 1篇
git 1篇
前端 3篇
Vue.js 7篇

最新评论

NSGA_2总结梳理附代码按行详细注解
anywayo: 怎么加约束呢
java 中String到底是值传递还是引用传递的问题
湿人四世湿诗: 应该没有吧。tolowercase在这个例子里没起作用
面向对象中的聚合与耦合的区别
偶尔躲躲乌云_Asterial: 宝，你是不是把别的人的帖子直接复制过来了，然后没有注明原作者呀
ThreadLocalMap中为什么valu是强引用，不是弱引用
谢谢你长得那么好看还给我点赞: 说的话好啰嗦啊
树莓派-ubuntu更换源报 E: Failed to fetch。。。。错误的解决办法
清风青枫29: 换了很多源了，这个确实最后能进，没有key的自行搜一下，sudo nano /etc/apt/sources.list 进去把中科大的复制进去，把默认的注释掉，再sudo nano /etc/apt/sources.list.d/raspi.list,把里面的注释掉就行，最后sudo apt update

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。