工作中经常会遇到这类问题:某张事实表中的字段是数组或者是map结构的数据,想把这里面的数据解析出来并且作为新字段和原来的表的表字段一块查看。
如果使用split的话,无法将解析出来的元素和原有字段一起观察,所以引出了explode这个udtf,这个函数配合split函数可以将一行数据变成多行数据,例如:
select explode(split('123,456,789',','))
结果:
123
456
789
但是这样还是不能将拆出来的元素拼接到原有表结构中,也就是说以下代码会报错
select col1,col2,col3,explode(split('123,456,789',',')) from table1
如果想要将拆分出来的元素拼接到原有表结构中并且一起查看的话,需要借助
LATERAL VIEW
,对拆分出来的数据构建一个虚拟视图,然后和原有结构做笛卡尔连接,最终达到一起查看数据的目的,实际代码如下:
SELECT *
FROM (
SELECT *, tmp1.add_col1
FROM (
SELECT *
FROM table1
WHERE pt = '${-1d_pt}'
) tmp
LATERAL VIEW explode(split(tmp.col1, '分隔符,如有特殊符号则需要转义')) tmp1 AS add_col1
) t
其中tmp1是构建出来的虚拟视图,add_col1是对col1列拆分出来的数据的列名。