问题说明
有时第三方提供的,导入进 Hive 表中的数据会清洗的不彻底,这里要说的就是遗留引号(“) 的问题。
比如
hive> select * from test;
1 "tom" 111
2 "cat" 222
3 "jack" 333
4 "hello" 444
处理后为
hive> select * from test;
a b c
1 tom 111
2 cat 222
3 jack 333
4 hello 444
解决
关键使用 regexp_replace() 这个函数。
select a, regexp_replace(b, '"', '') as b, c from test;
End!!