前言:
SQL查询不仅可以从一张变中查询数据,还可以从多张表中同时查询数据。连接查询就是最常见的一种多表查询。连接查询是对多个表进行JOIN运算,简单地说,就是先确定一个主表作为结果集,然后,把其他表的记录有选择性的“连接”到主表的结果集上。
正文:
举个例子,我们想要选出students表中的所有学生信息,可以用一条简单的SELECT语句完成:
SELECT s.id, s.name, s.class_id, s.gender, s.score FROM students s;
得到如下结果:
上面的结果集中只有class_id列,缺少对应班级的name列。现在我们希望在结果集上同时包含所在班级的名称。那么问题来了,存放班级名称的name列存储在classes表中,只有根据students表中的class_id找到classes表对应的行,再取出name列,就可以获得班级名称。此时,连接查询就派上了用场。
我们先来看最常用的内连接(INNER JOIN):
SELECT s.id, s.name, s.class_id, c.name class_name, s.gender, s.score
FROM students s
INNER JOIN classes c
ON s.class_id = c.id;
查询结果如下:
注意INNER JOIN查询的写法是:
1、先确定主表,使用FROM [表1]的语法;
2、再确定需要连接的表,使用INNER JOIN [表2]的语法;
3、然后确定连接条件,使用ON [条件…],上面的条件是s.class_id = c.id,表示students表的class_id列与classes表的id列相同的行需要连接;
4、可选:WHERE子句、ORDER BY子句等。
上面展示的就是内连接,有内连接就有外连接(OUTER JOIN)。我们把内连接查询改成外连接查询:
SELECT s.id, s.name, s.class_id, c.name class_name, s.gender, s.score
FROM students s
RIGHT OUTER JOIN classes c
ON s.class_id = c.id;
查询结果如下:
从结果看出,和INNER JOIN相比,RIGHT OUTER JOIN多出了一行,多出的那行显示“四班”,但是和学生相关的列,如name、gender、score都是NULL。
这是因为根据ON条件:s.class_id = c.id,classes表的id=4的行正是“四班”,但是students表中并不存在class_id=4的记录。
有了RIGHT OUTER JOIN,也就有LEFT OUTER JOIN,以及FULL OUTER JOIN。他们的区别在于:
1、INNER JOIN只返回同时存在于两张表的记录,由于students表的class_id包含1、2、3,classes表的id包含1、2、3、4。所以INNER JOIN根据ON条件s.class_id = c.id返回的结果集仅包含1、2、3。
2、RIGHT OUTER JOIN返回右表都存在的行记录。如果某一行记录仅在右边存在,那么结果集中其他字段都以NULL来填充。
3、LEFT OUTER JOIN返回左表中都存在的行记录。如果我们给students表增加了一行,并添加class_id=5,由于classes表并不存在id=5的行,所以LEFT OUTER JOIN的结果会增加一行,对应的class_name为NULL;
4、FULL OUTER JOIN会把两张表的所有记录全部选择出来,并且自动把对方不存在的列填充为NULL。
对于以上这么多种JOIN查询,到底什么情况下使用哪种JOIN呢?其实我们利用图示来表示结果集就很明了了。
SELECT ... FROM tableA <?> JOIN tableB ON tableA.column1 = tableB.column2;
我们把tableA看作左表,把tableB看作右表,那么以上各种连接的情况如下:
图1. INNER JOIN是选出两张表都存在的记录
图2. LEFT OUTER JOIN是选出左表存在的记录
图3. RIGHT OUTER JOIN是选出右表存在的记录
图4. FULL OUTER JOIN是选出左右表都存在的记录
总结:
JOIN连接查询需要先确定主表,然后将另一张表的数据“附加”到结果集上。
参考连接:https://www.liaoxuefeng.com/wiki/1177760294764384/1179610888796448