在应用hive写一些业务需求的时候一定会用到表之间的关联,对于初学者来说,一定要弄清楚内连接、外连接、左外连接、右外连接。下面通过具体的例子详解这几种连接方式。
建test1和test2两张表,并导入相应的数据
CREATE
test1表如图所示:
test2表图所示:
1、内连接
SELECT
内连接可以用inner join 或者join,返回两个表中满足条件的记录。
2、左外连接
SELECT
左外连接返回的记录数等于左表的记录数,右表不符合条件的记录标记为null。通常用于筛选在左表不在右表 或 在右表不在左表的记录数。
3、右外连接
SELECT
右外连接返回的记录数等于右表的记录数,通常用于筛选在左表不在右表或在右表不在左表中的记录 。
4、外链接
SELECT
外连接返回的记录数=在左表不在右表的记录+在右边不在左表的记录+既在左表又在右表中的记录。