Hive基本操作之Regex Serde

在Hive中,默认情况下只支持单字节的分隔符,如果我们需要用多字节作为分隔符,就需要使用正则序列化。

  • 建表
hive> create table if not exists test_regex(
    > id string,
    > name string,
    > age int
    > )
    > row format serde 'org.apache.hadoop.hive.serde2.RegexSerDe'
    > with serdeproperties(
    > 'input.regex'='(.*)\\|\\|(.*)\\|\\|(.*)',        #原始数据的正则
    > 'output.format.string'='%1$s %2$s %3$s'          #输出数据的格式
    > )
    > stored as textfile
    > ;
  • 创建数据文件
[root@hadoop01 test_data]# pwd
/usr/local/wyh/test_data
[root@hadoop01 test_data]# cat test_regex.txt
001||Jim||19
004||Alice||21
007||Bob||16
  • 导入数据
hive> load data local inpath '/usr/local/wyh/test_data/test_regex.txt' into table test_regex;
  • 查看数据
hive> select * from test_regex;
OK
001     Jim     19
004     Alice   21
007     Bob     16

这样就可以实现hive中多字节分隔符的数据读取。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

QYHuiiQ

听说打赏的人工资翻倍~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值