hive 自定义UDF,hive编译

最新推荐文章于 2023-11-01 17:19:11 发布

huguoping830623

最新推荐文章于 2023-11-01 17:19:11 发布

阅读量861

点赞数

分类专栏： hive 文章标签： hive自定义UDF

本文链接：https://blog.csdn.net/huguoping830623/article/details/45392899

版权

hive 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

hive增加临时函数

要自定一个hive的函数，步骤如下

1、写一个java类要继承org.apache.hadoop.hive.ql.exec.UDF类实现evaluate

下面是一个替换字符串的函数，因为函数以后是在hadoop上运行，所以数据类型是hadoop的数据类型

引入的jar包：hive的所有jar 和 hadoop的hadoop-common-2.5.2.jar

package hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public class CharRepace extends UDF{

	public Text evaluate(Text in,Text old, Text n){
		String result = in.toString().replace(old.toString(), n.toString());
		return new Text(result);
	}

}

把上面的代码打成NUDF.jar

2、添加jar包（在hive命令行里面执行）
hive> add jar /root/NUDF.jar;

3、创建临时函数
hive> create temporary function replace as 'hive.udf.CharRepace;

4.测试一下是否成功

hive> select replace(nation,'\t','') from tableName;

注意：这种方法每次使用都要add,create一下

add jar /root/NUDF.jar;drop temporary function replace;create temporary function replace as 'hive.udf.CharRepace;

hive编译，增加正式函数

上面只是添加临时的函数，如果想添加为正式函数，可以把代码添加到hive中，在重新编译jar。

编译步骤如下

1、把上面的java文件复制到 apache-hive-0.13.1-src/ql/src/java/org/apache/hadoop/hive/ql/udf 下边。当然java的package 要修改成package org.apache.hadoop.hive.ql.udf;

2、修改 org.apache.hadoop.hive.ql.exec.FunctionRegistry