如何创建 Hive 的 UDF?

UDF(User Defined Function)又称:用户自定义函数。可以像 concat, substr那样的 hive 内置的函数一样直接用于 select 语句,简化复杂查询。

编写 UDF 其实就是写一个类继承 org.apache.hadoop.hive.ql.exec.UDF 该类,在类里面写一个名为 evaluate 的方法,在方法里写相应的业务逻辑,最后打成 jar 包,提交到服务器上,在 hive 的命令行模式下添加这个 jar 包到环境变量,使用里面写好的 evaluate 方法。

编写 UDF 基本步骤

  • 所需 pom 文件如下:

    <dependency>
        <groupId>org.apache.hive</groupId>
        <artifactId>hive-exec</artifactId>
        <version>2.3.0</version>
    </dependency>
    
  • 继承 org.apache.hadoop.hive.ql.exec.UDF ,重写 evaluate 方法:

    package udf;
    
    import org.apache.hadoop.hive.ql.exec.UDF;
    
    /**
     * 用于判断员工薪水级别的函数
     */
    public class CheckSalaryGrade extends UDF {
    
    	public String evaluate(String salary) {
    		// 判断薪水的级别
    		int sal = Integer.parseInt(salary.trim());
    		
    		if (sal < 1000) {
    			return "Grade C";
    		} else if (sal < 3000) {
    			return "Grade B";
    		} else {
    			return "Grade A";
    		}
    	}	
    }
    
  • 打成 jar 包,提交到服务器上:
    在这里插入图片描述

  • 执行 hive 命令,启动 hive 的命令行模式

  • 添加 jar 包:
    在这里插入图片描述

  • 创建临时函数:

    create temporary function checksalary as "udf.CheckSalaryGrade";
    

    在这里插入图片描述

  • 使用 UDF 执行查询:

    select ename, sal, checksalary(sal) from emp;
    

    在这里插入图片描述

  • 销毁临时函数:

    drop temporary function checksalary;
    

    在这里插入图片描述

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值