黑猴子的家:Hive 列转行(UDTF)输入一行,输出多行

1、表结构

moviecategory
《疑犯追踪》悬疑,动作,科幻,剧情
《Lie to me》悬疑,警匪,动作,心理,剧情
《战狼2》战争,动作,灾难

2、movie.txt

《疑犯追踪》  悬疑,动作,科幻,剧情
《Lie to me》  悬疑,警匪,动作,心理,剧情
《战狼2》  战争,动作,灾难

3、创建表

hive> create table movie_info(
    movie string, 
    category array<string>) 
row format delimited fields terminated by "\t"
collection items terminated by ",";

hive 支持数组和字典,创建一个category数组列,用逗号分割

4、导入数据

hive> load data local inpath "movie.txt" into table movie_info;

5、将电影分类中的数组数据展开

统计某一个类型的电影都有哪些

《疑犯追踪》  悬疑,动作,科幻,剧情
《Lie to me》  悬疑,警匪,动作,心理,剧情
《战狼2》  战争,动作,灾难

     ↓

《疑犯追踪》  悬疑
《疑犯追踪》  动作
《疑犯追踪》  科幻
《疑犯追踪》  剧情
《Lie to me》  悬疑
《Lie to me》  警匪
《Lie to me》  动作
《Lie to me》  心理
《Lie to me》  剧情
《战狼2》  战争
《战狼2》  动作
《战狼2》  灾难
select
    movie,
    category_name 
from 
    movie_info lateral view explode(category) table_tmp as category_name;

注释

lateral view   侧写
explode  炸开
table_tmp  侧写表名
category_name 炸开后的数据

当你想从炸开的数据里面,直接获取原表中数据的关系的话,就需要用到侧写

9193428-4c708d8a19f5ebab.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值