Hive正则解析器RegexSerDe解析多字节字段

最新推荐文章于 2024-08-09 08:09:19 发布

panpan_ping

最新推荐文章于 2024-08-09 08:09:19 发布

阅读量399

点赞数

分类专栏： Hive 文章标签：笔记

本文链接：https://blog.csdn.net/banban_ping/article/details/90486632

版权

Hive 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

从table表中将name对应列的值抽取出来，通过
row format
serde ‘org.apache.hadoop.hive.serde2.RegexSerDe’with serdeproperties (‘input.regex’=’(.)\|\|(.)’,‘output.format.string’=’%1 $s$ s’)stored as textfile;
其中 (.*)代表字段名，两个括号之间为要分割的多字节分隔符，|（竖线）需要用双\ 转义，输出的字段为第一组%1 $s 第二组为$ s,其中$s为占位符。两个输出字段之间用英文空格隔开。