hive本身没有replace函数,可以用translate和regexp_replace函数代替
方法一
translate(列或符串,要转换的,转换成的)
方法二
regexp_replace(NVL(列名,""),"[\\s]+|[\u3000]+","")
该函数将匹配到的字符替换成""
说明:
[1]regexp_replace(要处理的列或字符串,"正则","将正则匹配到的字符串替换成该字符串")
[2]\\s+ 可以匹配任意的空白字符
\u3000 属于CJK字符的CJK标点符号区块内,是空白字符之一
+匹配前面的子表达式一次或多次
[3]regexp:正则
三扩展
1.去掉字段中的空格和逗号
regexp_replace(NVL(列名,""),"[\\s]+|[\u3000]+|[,]+","")
2.正则抽取:
regexp_extract
注:trim只能去掉首尾的空格或tab