Hive通过函数对数据的拆分

3 篇文章 0 订阅

记录一个数据拆分案例

select id,userid,
from_unixtime(cast(adddate/1000 as bigint),'yyyy-MM-dd') as adddate,
from_unixtime(cast(updatedate/1000 as bigint),'yyyy-MM-dd') as updatedate,
get_json_object(tag1,'$.id') as setting_id,
if(get_json_object(tag1,'$.enable') = 'true', 1 , 0) as enable 
from (
select id,tag1,userid,adddate,updatedate
from (select id,userid,adddate,updatedate,REPLACE(cast(substr(setting,2,length(setting)-2) as String),'},','}#') as aaa from 库名.表名 ) ta
lateral view explode(split(ta.aaa, '#')) r1 as tag1
)acc;

之前数据

在这里插入图片描述

拆分之后的数据

在这里插入图片描述

21021-07-02更新我的草稿本来了

数组里面的json拆分

insert overwrite table 库名.表名
select
tmp01.companyName,
get_json_object(ccc,'$.position') as position,
get_json_object(ccc,'$.personName') as personName
from(
select
get_json_object(companyBaseInfo,'$.companyName') as companyName,
REPLACE(REPLACE(REPLACE(zhuYaoChengYuan,'[',''),']',''),'},','}###') as tmp
from 库名.表名
)tmp01
lateral view explode(split(tmp01.tmp,'###')) rr as ccc;

原始数据
餐饮管理有限公司 [{“position”: “总经理”, “personName”: “陈1”}, {“position”: “监事”, “personName”: “谢11”}]

拆分之后

companyName position personName

餐饮管理有限公司 执行董事兼总经理 陈1
餐饮管理有限公司 监事 谢11

部分函数应用得当,可拆解正常遇到的多数数据;

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值