where条件是一个结果集_神奇的 SQL 之扑朔迷离 → ON 和 WHERE,好多细节

前言

神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(一)中,我们讲到了 3 种联表算法:SNL、BNL 和 INL,了解了数据的查询方式是 one by one,联表方式也是 one by one ;并谈到了 ON 和 WHERE,对下图中所说的提出了质疑

938ddd469bbe8dd1b77b27476b9c0ede.png

认为 ON 和 WHERE 的生效时机有待商榷;此时楼主开始了欠大家的账

神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(二)中对联表算法进行了补充,详细介绍了 MRR 和 BKA,但还是未介绍 ON 和 WHERE

SQL 执行顺序

SQL 的执行顺序相信大家多少有所了解,上网一搜也很快就能找到答案

27e595b5ab861290c2ea42bc63d5941e.png

除了 WITH 用的比较少之外,其他都比较常用,相信大家对上面的执行顺序也没有什么疑问;我们重点关注下 JOIN、ON 和 WHERE

2250d08ffe799c3712cb173af6b3381b.png

那么 WHERE 是不是一定是在 ON 之后生效了 ? 我们带着这个疑问往下看

ON 和 WHERE 的常规区别

on 针对的关联条件,是表与表之间通过哪些列、以什么条件进行关联,而 where 针对的是过滤条件;两者从概念上来讲是不同的

另外 on 一定是与 join 一并使用的,join 会添加外部行,并将外部行中被驱动表的字段填充 null ,而 where 进行过滤的时候,只有逻辑判断为 true 的记录才会保留,逻辑值为 false 和 unknown 的记录都会过滤掉(更多详情:神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !);两者得到的结果会有所不同

上面说的可能有些抽象,我们结合具体示例来看;MySQL 版本 5.7.21 ,准备表和初始数据

5db1fb4141c99c97554117b1bc40c578.png

我们先来看看 left join(right join类似)

SELECT * FROM tbl_a a LEFT JOIN tbl_b b ON a.a = b.a AND a.b = b.b; /*query_on*/SELECT * FROM tbl_a a LEFT JOIN tbl_b b ON a.a = b.a WHERE a.b = b.b; /*query_where*/
089dc387aa392b742e13f916c8414eaa.png

我们可以看到:

语句 query_on 返回了 tbl_a 中的全部记录,tbl_b 无对应记录的字段值填成 NULL,这是因为 join 会添加外部行,将 tbl_a 有而 tbl_b 中没有的记录添加到结果集

语句 query_where 返回的是 8 行。因为最后的一行,在表 tbl_b 中没有匹配的字段,所以 where 后的 b.b 的值是 NULL,而 a.b 的值是 9,那么 where 9 = NULL 的结果是 unknown 而不是 true,因此这条记录不能作为结果集的一部分

我们再来看看 inner join

SELECT * FROM tbl_a a INNER JOIN tbl_b b ON a.a = b.a AND a.b = b.b; /*query_on*/SELECT * FROM tbl_a a INNER JOIN tbl_b b ON a.a = b.a WHERE a.b = b.b; /*query_where*/
fcc75f6ac07b35772987898be9ff4368.png

我们可以看到,执行结果是一样的,inner join 查询的就是驱动表与被驱动表同时存在的记录,所以过滤条件不管放在 ON 里,还是放在 WHERE 里,执行结果是一样的

ON 和 WHERE 的生效时机

ON 后的关联条件与 WHERE 后的过滤条件,这两者的执行顺序是否如 SQL 执行顺序图中说的那样,ON 一定先与 WHERE ?

问题先放着,我们以 left join 为例,来看看 4 个案例,也许从中能找到我们想要的答案

1、左表与右表都没二级索引

刚好上面的 tbl_a 和 tbl_b 满足条件,我们来看看 SQL 的执行计划

efa10b6dd86e92d34a903e71ea80ee03.png

驱动表是 tbl_a,这个相信大家没问题,我们重点看下 type 和 Extra

type:上面的 ALL 表示全表扫描 a 表,下面的 ALL 表示全表关联,a 表中每一条满足条件的记录都会与 b 表中全部 9 条记录逐条进行关联

Extra:Using where 表示要进行 WHERE 条件过滤,Using join buffer (Block Nested Loop) 表示用到了 BNL

这条 SQL 的执行流程应该是这样的:

96149460679e332c4ca9bf05ea3e041f.png

此时大家看出什么了没 ? ON 后的关联条件是在 WHERE 后的过滤条件之前生效的吗 ?

这个案例不太常见,因为表没有二级索引,我们接着往下看看有二级索引的情况

2、左表有二级索引,右表无二级索引

我们在 tbl_a 建一个组合索引 create index idx_bcd on tbl_a(b, c, d); ,然后往 tbl_a 和 tbl_b 中各插入 10W 条记录,我们再来看执行计划

77406096b1ab3fafca2b16069d55874e.png

上图中红框标记的字段重点关注下,不知道字段含义的小伙伴,可以去翻翻我之前关于 explain的博客

那么此时 SQL 的执行流程应该是这样的:

6ea877613d7f5a76253dd6fa9c77a560.png

就步骤 1 与 示例 1 中的步骤 1 不同,其余 2 步是一样的

此时 WHERE 后的过滤条件的生效时机也是早于 ON 后的关联条件的

3、左表无二级索引,右表有二级索引

将 tbl_b 作为左表,tbl_a 作为右表,我们来看效果

bd7591d5982799df98767b604daabaad.png

此时 SQL 的执行流程应该是这样的:

0869377d341cbbc14ab49811a502f7ca.png

此时 ON 后的关联条件的生效时机是早于 WHERE 后的过滤条件的

4、左表与右表都有二级索引

我们在 tbl_b 表上建一个组合索引 create index idx_bcd on tbl_b(b, c, d); 我们来看看 SQL 的执行计划

60d6b4be487cd5094a5560cb39e70b82.png

此时 SQL 的执行流程应该是这样的:

e325ea10c2c3ec7e30029c8028f6a124.png

先是 WHERE 中的 Index Filter 条件生效,然后是 ON 后的关联条件生效,最后是 WHERE 中的 Table Filter 生效,关联条件的生效时间穿插在过滤条件的生效时间中

自此,关于 ON 和 WHERE 的生效时机,你清楚了吗 ?

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值