Hive load JSON数据类型

最新推荐文章于 2024-07-02 10:31:09 发布

857技术社区

最新推荐文章于 2024-07-02 10:31:09 发布

阅读量788

点赞数

分类专栏： Hive 文章标签： hadoop spark cloudera

本文链接：https://blog.csdn.net/qq_34635236/article/details/109179205

版权

Hive 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

用以下文本举例：

{"name":"Yin", "address":{"city":"Columbus","state":"Ohio"}}
{"name":"Michael", "address":{"city":null, "state":"California"}}

hdfs路径为：/user/maokaimin/jsontest/json.json

方法1：

建表

create external table maokaimin.jsontest (jsonObject string) location '/user/maokaimin/jsontest/json.json';

查询

SELECT
  v1.name, v2.city, v2.state
FROM maokaimin.jsontest
  LATERAL VIEW json_tuple(jsontest.jsonObject, 'name', 'address') v1
     as name, address
  LATERAL VIEW json_tuple(v1.address, 'city', 'state') v2
     as city, state;

方法2：

使用json-serde包

hadoop fs -put json-serde-1.1.9.9-Hive1.2-jar-with-dependencies.jar  hdfs:///xxxxx/script/hive_udf/

修改thrift-server启动参数

--jars hdfs:///xcardata/script/hive_udf/json-serde-1.1.9.9-Hive1.2-jar-with-dependencies.jar

注：以上环境为ambari,CDH也类似。分别在spark、Hive对应路径copy这个jar包或者在clouderamanager、ambari对应路径添加jar包即可，详细不在描述。

建表：

CREATE EXTERNAL table maokaimin.jsontest2(
name string, address STRUCT<city:String,state:string> )ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
LOCATION '/user/maokaimin/jsontest/json.json';

或者

CREATE EXTERNAL TABLE maokaimin.jsontest2
(`name` STRING,
`address` STRING)
partitioned by(day string)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
STORED AS TEXTFILE LOCATION '/user/maokaimin/jsontest/json.json';

查询

select name,address from maokaimin.jsontest2 limit 10 ;

857技术社区

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive load JSON数据类型

用以下文本举例：{"name":"Yin", "address":{"city":"Columbus","state":"Ohio"}}{"name":"Michael", "address":{"city":null, "state":"California"}}hdfs路径为：/user/maokaimin/jsontest/json.json方法1：建表create external table maokaimin.jsontest (jsonObject string) lo
复制链接

扫一扫