创建udf的方法:
udf开发 自定义标准函数:
自定义函数步骤:
第一步:集成UDF类,重写evaluate方法(转换为小写字母)
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;
public class Str2Lower extends UDF {
public Text evaluate(final Text s) {
if (s == null) {
return null;
}
return new Text(s.toString().toLowerCase());
}
}
第二步:打jar包,上传到集群
IDEA中如何正确快速打jar包
第三步:在Hive中添加jar包
add jar /root/jars/hadoopLearn-1.0-SNAPSHOT.jar;
第四步:创建函数
create [temporary] function str2lower2 as 'cn.kgc.hiveudf.Str2Lower';
临时函数:临时创建,退出终端后函数消失,在函数的有效期内,所有的数据库中都可以使用
永久函数:永久性使用,需要将jar包放到hdfs上,切换到其他的数据库不可用
过程如下:
// 把打好的jar包上传到hdfs上
hdfs dfs -mkdir /hiveudf
hdfs dfs -put hadoopLearn-1.0-SNAPSHOT.jar /hiveudf
// 添加jar包
add jar hdfs://hadoop1:9000/hiveudf/hadoopLearn-1.0-SNAPSHOT.jar;
// 创建永久函数
create function str2lower2 as 'cn.kgc.hiveudf.Str2Lower';
第五步:测试(调用)函数
遇到的坑:找不到打jar包的类
解决方法:
1.安装zip
yum install -y zip
2.删除签名文件
zip -d jar包地址 ‘META-INF/.SF’ ‘META-INF/.RSA’ ‘META-INF/*SF’
以上两步是在linux中做的
下面是在hive中操作
3.删除hive中的jar包
delete jar 自己放的jar包地址;
4.重新添加jar到hive中
add jar 自己放的jar包地址;
5.创建方法
create function str2lower2 as ‘cn.kgc.hiveudf.Str2Lower’;
这个创建的方法名只能使用,不可以查看