从table表中将name对应列的值抽取出来,通过
row format
serde ‘org.apache.hadoop.hive.serde2.RegexSerDe’with serdeproperties (‘input.regex’=’(.)\|\|(.)’,‘output.format.string’=’%1
s
s %2
ss’)stored as textfile;
其中 (.*)代表字段名,两个括号之间为要分割的多字节分隔符,|(竖线)需要用 双\ 转义,输出的字段为 第一组%1
s
第
二
组
为
s第二组为%2
s第二组为s,其中$s为占位符。两个输出字段之间用英文空格隔开。
Hive正则解析器RegexSerDe解析多字节字段
最新推荐文章于 2024-08-09 08:09:19 发布