背景
QL
中JOIN
子句是用于把来自两个或多个表的数据连接起来,在这个过程中可能会添加一些过滤条件。昨天有小伙伴问,如下图的这两种SQL
写法查询结果是否会一样?(好像这是某一年阿里的面试题)
这个问题提出来以后,多数小伙伴的回答是:查询结果应该是一样的吧,只是查询效率不一样。我当时的回答是,在Inner Join
时这两种情况返回的结果是一样的,在Left、Right
等情况时结果不一样。
案例
1、创建测试数据库和表并且插入用户测试的数据。
-- 创建数据库
CREATE DATABASE ods_study_1;
USE ods_study_1;
-- 创建表
CREATE TABLE ods_study_1.ods_study_join_a
(
study_id_a int
);
CREATE TABLE ods_study_1.ods_study_join_b
(
study_id_b int,
study_channel varchar(255)
);
-- 插入数据
INSERT INTO ods_study_1.ods_study_join_a(study_id_a) VALUES(1),(2),(3),(4),(5)
INSERT INTO ods_study_1.ods_study_join_b(study_id_b,study_channel) VALUES(1,'weixin'),(2,'zhihu'),(2,'zhihu'),(3,'toutiao');
2、查看一下原始的数据:
码字不易废话两句:有需要python学习资料的或者有技术问题交流 “点击”即可
结果验证
将上面的两个表Inner Joi
n和Left Join
,过滤条件分别放在on
和where
中。
1、Inner Join时
ON
中设置过滤条件
SELECT
*
FROM
ods_study_1.ods_study_join_a A
Inner JOIN
ods_study_1.ods_study_join_b B
ON (A.study_id_a = B.study_id_b AND B.study_channel='weixin')
Where
中设置过滤条件
SELECT
*
FROM
ods_study_1.ods_study_join_a A
Inner JOIN
ods_study_1.ods_study_join_b B
ON (A.study_id_a = B.study_id_b )
WHERE B.study_channel='weixin'
返回结果:
结论:Inner Join
时过滤条件放在on
和where
中返回结果一致。
2、Left Join时
ON
中设置过滤条件
SELECT
*
FROM
ods_study_1.ods_study_join_a A
LEFT JOIN
ods_study_1.ods_study_join_b B
ON (A.study_id_a = B.study_id_b AND B.study_channel='weixin')
返回结果:
Where
中设置过滤条件
SELECT
*
FROM
ods_study_1.ods_study_join_a A
LEFT JOIN
ods_study_1.ods_study_join_b B
ON (A.study_id_a = B.study_id_b )
WHERE B.study_channel='weixin'
返回结果:
结论:Left Join
时过滤条件放在on
和where
中返回结果不一致。
原因分析
可以这么理解,当两张表在Left Join
时,会生成一张连接临时表,然后再将这张连接临时表返回给用户。
在On
的情况下,是在生成临时表时起作用,但由于Left Join
的性质,就是他不管On
里面的过滤条件是否为真,都会返回左表里的记录。对于不满足条件的记录,右表字段全部是NULL
。
在Where
的情况下,是在临时表生成好以后起作用,在对临时表进行过滤。此时,只要条件不为真的行,全部都过滤掉了。
以上就是小编今天为大家带来的内容,小编本身就是一名python开发工程师,我自己花了三天时间整理了一套python学习教程,从最基础的python脚本到web开发,爬虫,数据分析,数据可视化,机器学习,等,这些资料有想要的小伙伴 " 点击 " 即可领取