UDF的编写和临时UDF的创建这里不说了,网上一大堆,只说永久UDF的创建
resources操作
Hive支持向会话中添加资源,支持文件、jar、存档,添加后即可在sql中直接引用,仅当前会话有效,默认读取本地路径,支持hdfs等,路径不加引号。例:add jar /opt/ht/AddUDF.jar;
添加资源
ADD { FILE[S] | JAR[S] | ARCHIVE[S] } <filepath1> [<filepath2>]*
查看资源
LIST { FILE[S] | JAR[S] | ARCHIVE[S] } [<filepath1> <filepath2> ..]
删除资源
DELETE { FILE[S] | JAR[S] | ARCHIVE[S] } [<filepath1> <filepath2> ..]
永久函数创建
CREATE FUNCTION [db_name.]function_name AS class_name [USING JAR|FILE|ARCHIVE 'file_uri' [, JAR|FILE|ARCHIVE 'file_uri'] ];
这里要注意,网上有两种方法,第一是先add,再create
add jar hdfs:///jars/hiveudf-1.0.4.jar;
create function startend as 'com.zyhxjh.data.StartEnd';
第二种
create function startend as 'com.zyhxjh.data.StartEnd' using jar 'hdfs:///jars/hiveudf-1.0.4.jar';
实测必须使用第二种,即using的办法,如果用第一种,当前会话克用,但关闭会话后就不能使用了。
这一步结束后执行
show functions;
show functions like '*startend';
就能找到这个函数了,但是还不能使用
reload funtion
这里要注意,一定要再所有hiveserver2的节点上都执行一下reload才可以,否则依然是会话使用。
最后,再创建udf的时候,最后指明库名,如果不指明,其他会话使用的时候需要使用默认库名default.function