在 Hive 中采用 Json 作为存储格式,需要建表时指定 Serde。Insert into 时,Hive 使用 json格式进行保存,查询时,通过 json 库进行解析。Hive 默认输出是压缩格式,这里改成不压缩。
具体操作步骤如下:
1) 将 json-serde-1.3.8-jar-with-dependencies.jar 导入到 hive 的/opt/module/hive/lib 路径下。
2) 在/opt/module/hive/conf/hive-site.xml 文件中添加如下配置:
<property> <name>hive.aux.jars.path</name> <value>file:///opt/module/hive/lib/json-serde-1.3.8-jar-with-dependencies.jar</value> </property> <property> <name>hive.exec.compress.output</name> <value>false</value> </property> |
创建表时需要设置如下:
ROW FORMAT SERDE
'org.openx.data.jsonserde.JsonSerDe' STORED AS TEXTFILE;