Hive Join的几种方式

下面实验几种hive中常用到的join操作

首先创建两个文件用于导入表中

hadoop@master:~/17$ cat data1
1,a
2,b
3,c
4,d
5,e
8,u
9,r
hadoop@master:~/17$ cat data2
1,aa
2,gg
7,www
19,ee


实验步骤:

1.创建hive表
create table a(id int, name string) row format delimited fields terminated by ',';
create table b(id int, name string) row format delimited fields terminated by ',';

2.导入数据
load data local inpath '/home/hadoop/17/data1' into table a;
load data local inpath '/home/hadoop/17/data2' into table b;


备注:

如果导入的文件有空行的情况,就会出现为NULL的行,判断条件为int用is NULL或者is not NULL判断,string 类型用='NULL'或者!='NULL'来判断

如果想把为NULL的行删除,可以这样

insert overwrite table a select * from a where id is not NULL;

3.inner join 
hive> select * from a inner join b on a.id=b.id;

1	a	1	aa
2	b	2	gg

4.left join
hive> select * from a left join b on a.id = b.id;

1	a	1	aa
2	b	2	gg
3	c	NULL	NULL
4	d	NULL	NULL
5	e	NULL	NULL
8	u	NULL	NULL
9	r	NULL	NULL

备注:左连接就是保留全部左表,连接on条件下的部分右表


5.right join
hive> select * from a right join b on a.id = b.id;

1	a	1	aa
2	b	2	gg
NULL	NULL	7	www
NULL	NULL	19	ee

备注:右连接就是保留全部右表,连接on条件下的部分左表


6.full outer join
hive> select * from a full outer join b on a.id = b.id;

1	a	1	aa
2	b	2	gg
3	c	NULL	NULL
4	d	NULL	NULL
5	e	NULL	NULL
NULL	NULL	7	www
8	u	NULL	NULL
9	r	NULL	NULL
NULL	NULL	19	ee

全连接:就是全部保留左右表

备注:left outer join 和 left join本质上是一个东西,同理于right outer join和right join


7.left semi join
hive> select * from a left semi join b on a.id = b.id;

1	a
2	b
备注:left semi join相当于是in的操作


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值