hive join时对于null,空字符串的处理

结论:(测试版本hive 1.1.0-cdh5.16.2)

join时如果关联字段值为null,则该行数据放弃,不会和其他表进行关联

join时如果关联字段值为空字符串,视为正常数据,会和其他表关联字段也为空字符串的行数据进行关联

 

测试如下:

create table tmp.test20200409_1 (id int,name string);
create table tmp.test20200409_2 (id int,name string);
insert into table  tmp.test20200409_1 values(1,'zbz'),(2,null),(3,'');
insert into table  tmp.test20200409_2 values(4,'zbz'),(5,null),(6,'');

 

inner join

select a.*,b.* from tmp.test20200409_1 a  join tmp.test20200409_2 b on a.name=b.name;

a.ida.nameb.nameb.id
1zbzzbz4
3  6

left join

select a.*,b.* from tmp.test20200409_1 a left join tmp.test20200409_2 b on a.name=b.name;

a.ida.nameb.nameb.id
1zbzzbz4
2nullnullnull
3  6

right join

select a.*,b.* from tmp.test20200409_1 a right join tmp.test20200409_2 b on a.name=b.name;

 

a.ida.nameb.nameb.id
1zbzzbz4
nullnullnull5
3  6

full join

select a.*,b.* from tmp.test20200409_1 a full join tmp.test20200409_2 b on a.name=b.name;

a.ida.nameb.nameb.id
1zbzzbz4
3  6
2nullnullnull
nullnullnull5

left semi join

select a.*,b.* from tmp.test20200409_1 a left semi join tmp.test20200409_2 b on a.name=b.name;

a.ida.name
1zbz
3 

cross join  

select a.*,b.* from tmp.test20200409_1 a cross join tmp.test20200409_2 b on a.name=b.name;

a.ida.nameb.nameb.id
1zbzzbz4
3  6

select a.*,b.* from tmp.test20200409_1 a cross join tmp.test20200409_2 b ;

a.ida.nameb.nameb.id
1zbzzbz4
2nullzbz4
3 zbz4
1zbznull5
2nullnull5
3 null5
1zbz 6
2null 6
3  6

 

 

 

 

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值