1.先下载对应版本的源码,地址:http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.15.1-src.tar.gz
2.找出对应的java文件,并对其修改
[hadoop@hadoop000 hive-1.1.0-cdh5.7.0]# find . -name FunctionRegistry.java
./ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java
3.修改FunctionRegistry.java文件,在文件的static块中参考其它函数的注册方法和导入自定义的java文件即可。例如参考:Substr这个函数
import org.apache.hadoop.hive.ql.udf.UDFSubstr;
import org.apache.hadoop.hive.ql.udf.UDFHello; // 添加自定义UDF的包
static {
system.registerGenericUDF("concat", GenericUDFConcat.class);
system.registerUDF("my_hello", UDFHello.class, false, new FunctionResource[0]); // 添加注册信息
system.registerUDF("substr", UDFSubstr.class, false);
...
}
4.进入UDFSubstr.java(实现Substr的文件)的同级目录,直接vi HelloWord.java ,然后复制黏贴感觉更效率。
[hadoop@hadoop000 hive-1.1.0-cdh5.7.0]# find . -name UDFSubstr.java
./ql/src/java/org/apache/hadoop/hive/ql/udf/UDFSubstr.java
UDFHello.java代码如下:
package org.apache.hadoop.hive.ql.udf;
import org.apache.hadoop.hive.ql.exec.Description;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;
@Description(
name = "hello",
value = "hello(String)",
extended = "return new Text(\"hello:\" + s.toString());"
)
public class UDFHello extends UDF {
public Text evaluate(final Text s) {
if (s == null) { return null; }
return new Text("Hello: " + s.toString());
}
public static void main(String str[]) {
System.out.println("hello");
Text s = new Text("abc");
System.out.println(new UDFHello().evaluate(s).toString());
}
}
5.由于此次编译的hive版本为:hive-1.1.0-cdh5.15.1 需要修改pom文件
<repositories>
......
<repository>
<id>cloudera</id>
<url>https://repository.cloudera.com/artifactory/cloudera-repos</url>
</repository>
</repositories>
6.编译 mvn clean package -Phadoop-2 -DskipTests -Pdist
4.将编译后的.jar拷贝到hive主服务节点,重启hive
cp /home/hadoop/source/hive-1.1.0-cdh5.15.1/ql/target hive-exec-1.1.0-cdh5.15.1.jar /home/hadoop/app/hive-1.1.0-cdh5.15.1/lib
5.进入hive检查是否存在该函数