hive中处理json数据的函数

最新推荐文章于 2024-06-20 00:09:20 发布

奈何@

最新推荐文章于 2024-06-20 00:09:20 发布

阅读量840

点赞数

分类专栏： # Hive函数文章标签： hive函数

本文链接：https://blog.csdn.net/sinat_26594945/article/details/116145428

版权

Hive函数专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文介绍了在Hive中处理JSON数据的两种方法。第一种是将JSON数据作为字符串，利用get_json_object和json_tuple函数进行解析。第二种是使用JsonSerDe，直接将JSON格式数据加载到表中，方便后续查询操作。这两种方法为Hive中的JSON数据处理提供了灵活性。

摘要由CSDN通过智能技术生成

Hive中处理json数据的两种方式
第一种：将json数据作为字符串进行处理
使用函数：
get_json_object：解析json数据，返回对应的数据
json_tuple：UDTF函数
使用案例：
–创建数据：vim /export/datas/hivedata.json
{“id”: 1701439105,“ids”: [2154137571,3889177061],“total_number”: 493}
{“id”: 1701439106,“ids”: [2154137571,3889177061],“total_number”: 494}
–创建表：
create table tb_json_test1 (
json string
);
–加载数据
load data local inpath ‘/export/datas/hivedata.json’ into table tb_json_test1;
–处理读取
select
get_json_object(t.json,’ $id'), get_json_object(t.json,'$ .total_number’)
from
tb_json_test1 t ;

select
t2.*
from
tb_json_test1 t1
lateral view
json_tuple(t1.json, ‘id’, ‘total_number’) t2 as c1,c2;

第二种：通过专门的解析类直接加载一个json格式的数据到Hive中
	使用案例：

–创建文件：vim /export/datas/hivedata.json
{“id”: 1701439105,“ids”: [2154137571,3889177061],“total_number”: 493}
{“id”: 1701439106,“ids”: [2154137571,3889177061],“total_number”: 494}
–添加jar包
add jar /export/datas/json-serde-1.3.7-jar-with-dependencies.jar;
–创建表：
create table tb_json_test2 (
id string,
ids array,
total_number int)
ROW FORMAT SERDE ‘org.openx.data.jsonserde.JsonSerDe’
STORED AS TEXTFILE;
–加载数据
load data local inpath ‘/export/datas/hivedata.json’ into table tb_json_test2;

奈何@

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive中处理json数据的函数

Hive中处理json数据的两种方式第一种：将json数据作为字符串进行处理使用函数：get_json_object：解析json数据，返回对应的数据json_tuple：UDTF函数使用案例：–创建数据：vim /export/datas/hivedata.json{“id”: 1701439105,“ids”: [2154137571,3889177061],“total_number”: 493}{“id”: 1701439106,“ids”: [2154137571,38891770
复制链接

扫一扫

专栏目录