1.今天遇到的一个建表任务为例,需要将表里的机型列做映射后与源表合并,是建表经常会遇到的场景,分享代码如下:
create table oppo_os_pso.temp_20200806_xiao0051 as
select brand,region,a.model,b.phone_type,weekno, man_ratio, total_person_num
from oppo_os_pso.temp_20200806_xiao005 a
join
(select phone_type, model, model2
from oppo_os_pso.phone_type
LATERAL VIEW explode(split(model,’,’)) model as model2)b on a.model = b.model2
order by brand,region,a.model,b.phone_type,weekno;
2.然后我们可以拆解一下上述语句:
creat table 库.要建的表 as
select 列,列,列
from 源表1 a
join
(select 列,列,列 from 库.源表2
LATERAL VIEW explode ( split ( 列 , ‘,’ ) ) 列 as 列) b
on a.列 = b.列
order by 列,列,列
3.可能需要说明的点:
① 建表 creat table XXX as select XXX from XXX
② 映射 a join b on a.列 = b.列 (匹配上model机型的,返回b表的phon_type)
JOIN: 如果表中有至少一个匹配,则返回行
LEFT JOIN: 即使右表中没有匹配,也从左表返回所有的行
RIGHT JOIN: 即使左表

本文通过一个实际的建表任务介绍了如何在Hive中创建表,特别是涉及join、lateral view和explode等操作。讲解了creat table as select的语法,以及join的不同类型。还重点解释了explode和lateral view的用法,它们用于将数组结构拆分成多行,并且展示了在实际案例中的应用。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



