Hive 处理 json 数据就是这么简单高效

本文介绍了如何在Hive中高效处理JSON数据,重点关注get_json_object和json_tuple两个函数的使用。get_json_object适用于一般JSON解析,而json_tuple在返回多个字段时更具优势。当遇到JSON数组时,explode函数成为了解析的关键,通过explode(array)可以将数组元素拆分成多行。
摘要由CSDN通过智能技术生成

今天这篇文章主要分析一下 hive 清洗 json 格式的数据,常用的两个函数。

第一个是

get_json_object

hive中解析一般的json是很容易的,使用 get_json_object 就可以了。 get_json_object 函数第一个参数填写json对象变量,第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组;

例子:

select get_json_object('{"name":"jack","server":"www.qq.com"}','$.server')

json_tuple

对与返回多个字段的场景,它比 json_tuple 更加高效。具体是如何使用呢,下面给个实例

 

select 
a.timestamp,
get_json_object(a.appevents, '$.eventid'), 
get_json_object(a.appenvets, '$.eventname') 
from log a;

可以改成如下写法:

select
a.timestamp,
b.*
from log a 
lateral view json_tuple(a.appevent, 'eventid', 'eventname') b as f1, f2;

explode

但如果字段是json数组,比如

[{"bssid":"6C:59:40:21:05:C
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值