创建一个maven项目
引入jar包
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>org.example</groupId>
<artifactId>myudf</artifactId>
<version>1.0-SNAPSHOT</version>
<properties>
<maven.compiler.source>8</maven.compiler.source>
<maven.compiler.target>8</maven.compiler.target>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties>
<dependencies>
<!--hive依赖 -->
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-exec</artifactId>
<version>3.1.2</version>
</dependency>
<!--hadoop依赖 -->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>3.3.0</version>
</dependency>
</dependencies>
</project>
创建类继承UDF并重载evaluate方法
evaluate方法在父类中找不到,但是可以使用
UDF会提示过时,不影响使用
public class MyUDF extends UDF {
// 这个evaluate方法在父类中找不到,但是可以使用
public String evaluate(String phoneStr){
// 这里是一个简单的电话加密例子
String str1 = phoneStr.substring(0,3); //156
String str2 = phoneStr.substring(7); //7890
return str1 + "****" + str2; //156****7890
}
}
执行maven打包程序
上传到安装的hive的lib目录下
在客户端执行添加包命令
我使用的是datagrip连接hive执行命令
add jar /export/server/hive-3.1.2/lib/myudf.jar;
在客户端执行添加临时函数命令
临时函数在关闭会话后会失效
create temporary function myudf2 as 'org.example.MyUDF';
测试自定义函数
select myudf2('15612345678')