hive合并数组

本文介绍如何在Hive中合并两个数组并实现去重。通过LATERAL VIEW和explode函数分解数组,然后利用collect_set与group by组合,将同一productid的city_tags和hotel_tags合并成不重复的数组。
摘要由CSDN通过智能技术生成

hive合并数组

将上图中红框的两个数组合并为一个数组并去重,也就是同一个productid对应的city_tags和hotel_tags取并集

第一步,先将数组中的数据全部取出来 使用LATERAL VIEW、explode 2个函数,可以实现把一个array类型的值分开

SELECT t.productID, t.cityID,t.airlineCode,t.hotelID,tagv FROM (SELECT productID, cityID,airlineCode,hotelID, tagids FROM  product_pbs.origin_pbs_product ) t LATERAL VIEW explode(t.tags) v AS tagv 
 UNION ALL SELECT t.productID,t.cityID,t.airlineCode,t.hotelID, tagv  FROM (SELECT productID,cityID,airlineCode,hotelID, hotelTags FROM  product_pbs.origin_pbs_product ) t LATERAL VIEW explode(t.tagids) v AS tagv

第二步:使用collect_set函数配合group by将同一个productid对应的tagv进行合并为同一个数组


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值