sparkSQL之拆分Map为多列

发现问题

今天给同事处理标签的时候,
需要统计核实一下tags里面所有tags分类量级。
这是hive库里面数据的格式。
表结构
数据标签里面的tags里面是标签名,权重值

解决思路

step1.给Map炸开成两列 这样就可以把所有的标签名拿出来了
step2.拿出所有的key值和did_md5的值
step3.针对key值进行聚合和统计

写sql代码

sql代码

得到结果

在这里插入图片描述

总结(复习)

lateral view outer explode(tags)kv as k,v
tags里面有几个就炸几行

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值