Hive Lateral View

目录

Hive explode介绍:

Hive posexplode介绍:

Lateral View介绍:

使用多个Lateral View:

outer关键字:


Hive explode介绍:

它会将一行数据转成多行,也就是将行数据转成列数据,它所接收的参数为array和map类型的数据,语法如下:

array参数:

select explode(array) as arr_name from tableName;

map参数

select explode(map) as (map_key,map_value) from tableName;

Hive posexplode介绍:

与explode不同的是他会多生成一列索引值,从0开始。

Lateral View介绍:

Lateral view is used in conjunction with user-defined table generating functions such as explode(). As mentioned in Built-in Table-Generating Functions, a UDTF generates zero or more output rows for each input row. A lateral view first applies the UDTF to each row of base table and then joins resulting output rows to the input rows to form a virtual table having the supplied table alias.

Lateral View与用户定义的函数(如explode())结合使用。UDTF为每个输入行生成零个或多个输出行。Lateral View首先将UDTF应用于表的每一行,然后将生成的输出行与输入行连接起来,以形成具有提供的表别名的虚拟表。

这个虚拟表会和输入的行进行join,达到连接UDTF外的select字段的目的。

如下:

也可以使用posexplode:

也可以再进一步进行聚合:

使用多个Lateral View:

将上面表的page_id也改为多个用逗号隔开的形式,如下

将page_id和addid_list都拆分开:

如果想要不要重复数据,也可以使用posexplode,然后加一个where条件,上面的数据不太合适,但是效果是相同的,几front_page-1给1,front_page-2给2,contact_page-1给4,contact_page-2给5:

其实我们发现两个列拆分后就是进行了一个全连接。

outer关键字:

UDTF默认是忽略输出空的,outer关键字的作用是在UDTF转换列的时候将其中的空也给展示出来,显示为NULL,如下:

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值