Hive 处理 json 的几个函数

本文参考:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

get_json_object

hive中解析一般的json是很容易的,使用 get_json_object 就可以了。
get_json_object 函数第一个参数填写json对象变量,第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组;

例子:

select get_json_object('{"name":"jack","server":"www.qq.com"}','$.server')

json_tuple

对与返回多个字段的场景,它比 json_tuple 更加高效。具体是如何使用呢,下面给个实例

select 
a.timestamp,
get_json_object(a.appevents, '$.eventid'), 
get_json_object(a.appenvets, '$.eventname') 
from log a;

可以改成如下写法:

select
a.timestamp,
b.*
from log a 
lateral view json_tuple(a.appevent, 'eventid', 'eventname') b as f1, f2;

explode

但如果字段是json数组,比如

[{"bssid":"6C:59:40:21:05:C4"},{"bssid":"AC:9C:E4:04:EE:52","ssid":"and-Business"}]

直接调用 get_json_object 返回空值。这样的话对于不会写UDF的同学来说,解析json数组就变得很棘手,好在 hive 中自带了 explode 函数,从而让解析 json数组 变得有可能了。这里先介绍一下 explode 的使用方法:

explode(array)

select explode(array('A','B','C')) as col;
select tf.* from (select 0 from dual) t lateral view explode(array('A','B','C')) tf as col;

运行结果:

col 1
C
B
C
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值