在Hive中读取Json格式数据

最新推荐文章于 2023-08-28 22:51:40 发布

weixin_34245749

最新推荐文章于 2023-08-28 22:51:40 发布

阅读量424

点赞数

文章标签：大数据 json python

原文链接：https://my.oschina.net/aibati2008/blog/698535

版权

2019独角兽企业重金招聘Python工程师标准>>>

如果有时候遇到数据源是json的格式(比如直接读取mongoDB的数据), hive解析就要麻烦一点, 主要有以下2种方法:

1、将json以字符串的方式整个入Hive表，然后使用LATERAL VIEW json_tuple的方法(相当于生成json串的模型)，获取所需要的列名。这种方法还是比较麻烦,尤其是字段多的时候, 第二种方法用起来更方便.

2、使用第三方的SerDe将json拆成各个字段入Hive表里, 我使用的是hive1.2.1可以正常使用, 下载地址:http://download.csdn.net/download/ls386239766/8662797

# 添加jar包
hive> add jar /usr/local/hive/lib/json-serde-1.3-jar-with-dependencies.jar;
hive> 

# 创建hive表
CREATE TABLE test_json
(
    id BIGINT,
    text STRING,
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.JsonSerde'
STORED AS TEXTFILE
;

LOAD DATA LOCAL INPATH "test.json" OVERWRITE INTO TABLE test_json;

如果觉得每次运行都要加载这个jar包比较麻烦, 可以把jar包路径添加到hive-env.sh里.

转载于:https://my.oschina.net/aibati2008/blog/698535

weixin_34245749

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
在Hive中读取Json格式数据

2019独角兽企业重金招聘Python工程师标准>>> ...
复制链接

扫一扫

weixin_34245749 CSDN认证博客专家 CSDN认证企业博客

码龄9年

156: 原创

-: 周排名

110万+: 总排名

274万+: 访问

: 等级

8077: 积分

4910: 粉丝

202: 获赞

15: 评论

1286: 收藏

私信

关注

热门文章

最新评论

为何float有效位数为7位？
水中贵族派大星: 每个float都可以表示为1.xxxx.2^n，即符号位指数位尾数位除了0这一特殊情况，尾数位23位，实际应是25位，我们可以把1.省略掉不进行存储，使用时直接给xxx前面填上就行了
mac 邮件自动归类
2301_76771281: 大咖,你好! 我也是这种方法设置的, 设置了很多个指定文件夹,但是很奇怪所有的邮件来直接去另一个不对称的文件夹,这个是怎么回事
为何float有效位数为7位？
cdalearner: [code=csharp] #include <stdio.h> void main(void) { float f1=12345.67f; printf("%f\n",f1);/* return:12345.669922 */ } [/code] 输入值和返回的数值只有6位有效数字相同。这个反例如何解释？......
顾维灏谈百度地图数据采集：POI自动处理率达90%
nandou_xinxi: 地图客户采集工具(找客户、开店选址、调研市场)必备工具软件下载地址: https://www.nandou-china.com/mapPoiExport.html
为何float有效位数为7位？
iamsobrave: 这个涉及到计组里的知识。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。