文档编写目的
Hive在0.14及以后版本支持字段的多分隔符,参考:
https://cwiki.apache.org/confluence/display/Hive/MultiDelimitSerDe
而Fayson在以前的文章中也基于C5的环境介绍过如何在Hive中使用多分隔符,参考《Hive多分隔符支持示例》。本文主要介绍在CDH6中如何让Hive支持多分隔符。
- 测试环境
1.Redhat7.2
2.CDH6.2.0
3.Hive2.1
数据准备
如何将多个字符作为字段分割符的数据文件加载到Hive表中,示例数据如下:
字段分隔符为“@#$”
test1@#$test1name@#$test2valuetest2@#$test2name@#$test2valuetest3@#$test3name@#$test4value
如何将上述示例数据加载到Hive表(multi_delimiter_test)中,表结构如下: