一、结论 - on和where的区别
数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
在使用 left join 时,on 和 where 条件的区别如下:
- 1、 on 条件是在生成临时表时使用的条件,它不管 on 中的条件是否为真,都会返回左边表中的记录。
- 2、where 条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有 left join 的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
二、举例解释
假设有两张表:
表1:tab1
id | size |
---|---|
1 | 10 |
2 | 20 |
3 | 30 |
表2:tab2
size | name |
---|---|
10 | AAA |
20 | BBB |
20 | CCC |
两条 SQL:
select * from tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name='AAA'
select * from tab1 left join tab2 on (tab1.size = tab2.size and tab2.name='AAA')
详细解释第二条sql为什么返回的不是4条而是3条?
这条查询语句使用了左连接(left join),它会返回左表(tab1)中的所有记录,以及右表(tab2)中与左表匹配的记录。连接条件是 tab1.size = tab2.size and tab2.name=‘AAA’,也就是说,只有在 tab2.name 为 ‘AAA’ 且 tab1.size 等于 tab2.size 的情况下,才会将两表的记录连接起来。
现在我们来分析具体的连接过程:
- tab1.id = 1, tab1.size = 10
在 tab2 中查找 size = 10 且 name = ‘AAA’ 的记录:存在一条符合条件的记录。
结果集中会包括 tab1.id = 1 对应的这条记录。
- tab1.id = 2, tab1.size = 20
在 tab2 中查找 size = 20 且 name = ‘AAA’ 的记录:这里并没有符合条件的记录。
因为是左连接,所以即使在 tab2 中没有符合条件的记录,也会返回 tab1 的这条记录。
结果集中会包括 tab1.id = 2 对应的这条记录。
- tab1.id = 3, tab1.size = 30
在 tab2 中查找 size = 30 且 name = ‘AAA’ 的记录:这里也没有符合条件的记录。
同样因为是左连接,会返回 tab1 的这条记录。
结果集中会包括 tab1.id = 3 对应的这条记录。
因此,根据左连接的性质以及连接条件 tab2.name = ‘AAA’,最终的结果集中只会包括满足条件的记录和左表中没有匹配的记录。在这个例子中,只有 tab2 中 size = 10 且 name = ‘AAA’ 的记录满足条件,因此结果集中只会返回 3 条记录。
所以,这就解释了为什么查询语句 select * from tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=‘AAA’) 返回了 3 条记录而不是 4 条记录。
三、总结
其实以上结果的关键原因就是 left join、right join、full join 的特殊性,不管 on 上的条件是否为真都会返回 left 或 right 表中的记录,full 则具有 left 和 right 的特性的并集。 而 inner jion 没这个特殊性,则条件放在 on 中和 where 中,返回的结果集是相同的
select * from tab1 INNER join tab2 on tab1.size = tab2.size WHERE tab2.name='AAA'
select * from tab1 INNER join tab2 on tab1.size = tab2.size and tab2.name='AAA'
inner jion返回的是相同的