遇到的问题:
1、add jar后找不到类: FAILED: Class com.udf.udf.TestUdf not found
2、建函数没有权限,报延签的错误: java.lang.SecurityException: Invalid signature file digest for Manifest main attributes
chmod 755 you.jar
搭建流程:
1、新建一个java项目,新建lib项目
2、将hive集群下面的lib文件夹下面的所有jar(除开php,py)拷贝到lib下面
3、将jar添加到依赖管理
4、新建udf类:
package com.udf.test;
import org.apache.hadoop.hive.ql.exec.UDF;
public class UdfTest extends UDF {
public int evaluate(int a,int b){
return a+b;
}
}
5、将项目打成jar
6、注意一般工具打包都会给jar延签,使用者有权限验证,所以需要删除权限认证,在linux上面执行:
zip -d your.jar 'META-INF/.SF' 'META-INF/.RSA' 'META-INF/*SF' 注意是每次打了新包都需要这个删除操作
6、进入hive控制台:add jar /home/hive/jar/udf.jar; -- 你自己的路径
7、创建临时函数:
create temporary function udftests AS 'com.udf.test.UdfTest'; -- com.udf.test.UdfTest是类的路径
8、使用函数:select udftests(20,40);
9、至此就是一个完整的建立udf的流程,如果要建立永久函数,
那么需要将jar放到hdfs或者配置:create function udf_number AS 'com.udf.test.UdfTest' using jar 'hdfs:///hive_jar/udf.jar';
注意这里不要加ip和端口,如果远程创建才需要,本地集群只需要hdfs:///就可以了
或者hive-env.sh配置文件中添加HIVE_AUX_JARS_PATH