使用Hive 过程中 需要做一些UDF的开发,简单贴一个UDF 是用来去除字符串中的所有中英文符号
本人Java菜鸟 代码可能不好看勿喷啊。仅供参考
package com.fccs.utils;
import java.text.ParseException;
import org.apache.Hadoop.hive.ql.exec.UDF;
/***
* 本类是用于字符串替换支持正则表达
* @author yqj@fccs.com
* @date 2015-5-28
* @version 1.0
*
*/
public class F_str_replace extends UDF{
public String evaluate(String str,String ...args) {
if(str != null){
str = str.trim();
}
if(str == null || "".equals(str)){
return "null";
}
return get_str_replace( str,args);
}
/**
* 传入一个字符串,把所有符合条件的字符串和空字符转换为“null”,不符合条件的就返回原字符串
* 比如:get_str_replace("金成·江南春城 (·竹海水韵)")
* 转换后:"金成江南春城竹海水韵"
* @par