hive处理json格式数据,有变量名接收json串
hivemsg={
"name": "Tom",
"server": "abc.com"
}
提供的方法有两种get_json_object()和json_tuple()两种函数方法。
select get_json_object('${hivemsg}','$.server') from test;
#如果"server"对应的是一个数组,还可以使用$.server[0]来使用数据
select json_tuple('${hivemsg}','name','server') from test;
区别:get_json_object()是获得一个json中的数据对,
json_tuple()可以获得多个json中的数据对
无变量名接收json串
//假如一个字段exts的值为下面数据
{
"name": "Tom",
"server": "abc.com"
}
//此种情况第一个变量无需加引号
select get_json_object(exts,'$.server') from test;
select json_tuples(exts,'name','server') from test;
超级大坑
select json_tuple(exts,‘a’,‘b’) from 表A;是OK的,但是,
注意!注意!不能在使用json_tuple()的时候,在select其余字段,
select json_tuple(exts,‘a’,‘b’) ,c from 表A; 回报错的!!!
使用方式:
使用lateral view虚拟表的形式。
select a.flist
,b.filtertype
,b.filtersubtype
,b.filtername
from aaaaaaaaa a
lateral view json_tuple(flist,'filtertype', 'filtersubtype', 'filtername') b as
filtertype, filtersubtype,filtername;