Hive默认分隔符介绍

Hive分隔符

Hive建表时,默认使用的分隔符时候一个特殊的字符,查看表决结构时候是一个’\001’
这不是真正的’\001’,其实是使用八进制编码\001表示,以下为该分隔符使用和编辑的方法

分隔符使用

1 linux/Mac vi/vim 进入文本编辑
\001 用ctrl+v然后再ctrl+a
\002 用ctrl+v然后再ctrl+b
2 Java实现 
\001: 
byte[] bytes = new byte[] {1}; String splitString=new String(bytes ,"GBK");  或者 String splitString = ""+((char) ((int) 1));
\002 用ctrl+v然后再ctrl+b
\002 : 
byte[] bytes = new byte[] {2}; String splitString=new String(bytes ,"GBK");  或者 String splitString = ""+((char) ((int) 2));

分隔符优点

1 保证数据完整性,在数据抽取存储中通过该分隔符进行分割,非常有效组织了和数据内容冲突的情况。ETL清洗中最为明显
2 很多导入导出工具,不支持多字符分隔符情况单字符满足不了数据切分时
##该分隔符缺点
1 作为key时候shell中不好进行拼接查询,比如hbase.redis等
2 临时操作时不好进行展示,对不知道该分隔符的人会认为没有进行切分。
  • 5
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值