hive行专列,列转行

1. 假设我们在hive中有两张表,其中一张表是存用户基本信息,另一张表是存用户的地址信息等,表数据假设如下:

user_basic_info:

idname
1a
2b
3c
4d
user_address;

nameaddress
aadd1
aadd2
badd3
cadd4
dadd5
我们可以看到同一个用户不止一个地址(这里是假设的),我们需要把数据变为如下格式:

idnameaddress
1aadd1,add2
2badd3
3cadd4
4dadd5
collect_set 这就用到了hive中的行转列的知识,需要用到两个内置UDF: collect_set, concat_ws,

两个函数解释如下见:http://www.cnblogs.com/end/archive/2012/06/18/2553682.html

建表:

[sql]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. create table user_basic_info(id string, name string);  
  2. create table user_address(name string, address string);  
加载数据:

[sql]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. load data local inpath '/home/jthink/work/workspace/hive/row_col_tran/data1' into table user_basic_info;  
  2. load data local inpath '/home/jthink/work/workspace/hive/row_col_tran/data2' into table user_address;  

执行合并:

[sql]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. select max(ubi.id), ubi.name, concat_ws(',', collect_set(ua.address)) as address from user_basic_info ubi join user_address ua on ubi.name=ua.name group by ubi.name;  

运行结果:

1       a       add1,add2
2       b       add3
3       c       add4
4       d       add5

2. 假设我们有一张表:

user_info:

idnameaddress
1aadd1,add2
2badd3
3cadd4
4dadd5
我们需要拆分address,变为:

idnameaddress
1aadd1
1aadd2
2badd3
3cadd4
4dadd5

我们很容易想到用UDTF,explode():

select explode(address) as address from user_info;

这样执行的结果只有address, 但是我们需要完整的信息:

select id, name, explode(address) as address from user_info;

这样做是不对的, UDTF's are not supported outside the SELECT clause, nor nested in expressions

所以我们需要这样做:

select id, name, add from user_info ui lateral view explode(ui.address) adtable as add;

结果为:

1       a       add1
1       a       add2
2       b       add3
3       c       add4
4       d       add5


  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值