大数据操作之hive对json数据进行处理

最新推荐文章于 2024-07-01 19:31:42 发布

大数据架构师Pony

最新推荐文章于 2024-07-01 19:31:42 发布

阅读量470

点赞数

分类专栏：大数据之Hive 文章标签：大数据操作之hive对json数据进行处理

本文链接：https://blog.csdn.net/u011110301/article/details/104199463

版权

大数据之Hive 专栏收录该内容

43 篇文章 3 订阅

订阅专栏

原始json数据：

[{"website":"www.it.cn","name":"helloword"},{"website":"cloud.it.com","name":"carbondata 中文文档"}]

--第一步操作把json数组中元素的分隔符从,替换成为; 避免切割的时候产生歧义

语句：

select regexp_replace('[{"website":"www.it.cn","name":"helloword"},{"website":"cloud.it.com","name":"carbondata 中文文档"}]', '\\}\\,\\{','\\}\\;\\{');

结果如下：

+----------------------------------------------------+--+
| _c0 |
+----------------------------------------------------+--+
| [{"website":"www.it.cn","name":"helloword"};{"website":"cloud.it.com","name":"carbondata 中文文档"}] |
+----------------------------------------------------+--+

--第二步操作把数据首尾的[]替换成为空

语句：

select regexp_replace(regexp_replace('[{"website":"www.it.cn","name":"helloword"},{"website":"cloud.it.com","name":"carbondata 中文文档"}]', '\\}\\,\\{','\\}\\;\\{'),'\\[|\\]','');

结果如下：

+----------------------------------------------------+--+
| _c0 |
+----------------------------------------------------+--+
| {"website":"www.it.cn","name":"helloword"};{"website":"cloud.it.com","name":"carbondata 中文文档"} |
+----------------------------------------------------+--+

--第三步：根据分隔符;进行切割返回的Array(String)
--最后：把切割的结果交给explode函数炸开

select json_tuple(json, 'website', 'name') from (SELECT explode(split(regexp_replace(regexp_replace('[{"website":"www.it.cn","name":"helloword"},{"website":"cloud.it.com","name":"carbondata 中文文档"}]', '\\}\\,\\{','\\}\\;\\{'),'\\[|\\]',''),'\\;')) as json) it;

大数据架构师Pony

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
大数据操作之hive对json数据进行处理

原始json数据：[{"website":"www.it.cn","name":"helloword"},{"website":"cloud.it.com","name":"carbondata 中文文档"}]--第一步操作把json数组中元素的分隔符从,替换成为; 避免切割的时候产生歧义语句：select regexp_replace('[{"website":"www.i...
复制链接

扫一扫