1、创建一个类继承自UDF,并重写evaluate方法
import org.apache.hadoop.hive.ql.exec.UDF;
import java.util.Arrays;
public class UDFTest extends UDF {
public static String evaluate(String str) {
String[] Arr = str.split(",");
for(int i = 0;i < Arr.length;i++){
if(Arr[i].equals("铁件")){
Arr[i] = "A:铁件";
}else if(Arr[i].equals("铜")) {
Arr[i] = "B:铜";
}else if(Arr[i].equals("铝件")) {
Arr[i] = "C:铝件";
}else if(Arr[i].equals("金件")) {
Arr[i] = "D:金件";
}
}
Arrays.sort(Arr);
String ss = "";
for(int i = 0;i < Arr.length;i++){
if(i < Arr.length - 1){
ss = ss + Arr[i].split(":")[1] + ",";
}else{
ss = ss + Arr[i].split(":")[1];
}
}
return ss;
}
}
2、将程序打包,并将打好的包上传到hive的lib目录下或者上传到hdfs
区别是,如果要将udf注册成临时方法那就上传到lib目录下,而如果要注册成永久方法最好是上传到hdfs,否则在集群中运行的时候,会找不到方法
//1、注册成临时方法
hive> create temporary function selfSort AS 'UDFTest';
//2、删除临时方法
hive> drop temporary function UDFTest;
//3、注册成永久方法
hive> create function selfSort as 'UDFTest' using jar 'hdfs:/jar/HotItemsAnalysis-1.0-SNAPSHOT.jar';
注册完成以后可以hive> show functions;查看方法是否成功注册