Hive框架(三) —— 解析json数组

解析json数组的函数通常有

  • get_json_object() 
  • json_tuple() 
  • split() 
  • explode() 
  • regexp_replace() 
  • lateral view 

get_json_object() 一次只能解析一个key,当需要解析多个字段时,不好用

于是使用 json_tuple() 函数,结合lateral view() 使用

一个解析json数组的思路:

对于如下的字段,其中内容是

[{"website":"baidu.com","name":"百度"},{"website":"google.com","name":"谷歌"}]

思路如下:

1. 先用 regexp_replace('[ ...]'  , ' \\[ | \\] ' , ' ' )  来去掉数组两边的中括号 

2. 再用 regexp_replace(1的结果,  '\\}\\,\\{' ,  '\\}\\;\\{' )   将json数组元素之间的逗号换成分号,以便后面使用split()分隔 

3. 使用split(2的结果, ’\\;‘)     按分号切割元素

4. explode(3的结果)   

将上述4步作为一个子查询,外面套一个lateral view形成侧写表。注意:当有多个explode()时,用多个 lateral view 形成多个侧写表,解决遇到UDTF时,select 只支持一个字段的问题

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值