在处理日志数据时,会遇到json格式的数据。那么,在hive中如何处理它呢?
一般情况下,json数据会以string类型,字符串格式进行存储。
-
创建案例
create database temp_db; --drop database temp_d; --这次导入的数据中使用空格来分割 create table temp_db.json_test (id int comment '源数据库id主键', str string comment '日志字符串') row format delimited fields terminated by ' ' lines terminated by '\n'; 注意:在Hive0.8开始支持Insert into语句 insert into temp_db.json_test(id,str) values (1,'{"name":"孙先生","carrer":"大数据开发工程师","dream":["开个便利店","去外面逛一逛","看本好书"],"friend":{ "friend_1":"MM", "friend_2":"NN", "friend_3":"BB", "friend_4":"VV" } }'); insert into temp_db.json_test(id,str) values (2,'{"name":"唐女士","carrer":"退休农民","dream":["儿子听话","带孙子&#