Hive的自定义查询函数

Hive的自定义查询函数

1. Hive的自定义函数(UDF): User Defined Function
可以直接应用于select语句,对查询结构做格式化处理后,再输出内容。

2. Hive自定义函数的实现细节
自定义UDF需要继承org.apache.hadoop.hive.ql.UDF。
需要实现evaluate函数,evaluate函数支持重载。

3. Hive自定义函数案例
案例一: 拼接两个字符串

package udf;

import org.apache.hadoop.hive.ql.exec.UDF;

public class MyConcatString extends UDF {

	/**
	 *   自定义的连接函数
	 * @param a
	 * @param b
	 * @return
	 */
	public String evaluate(String a, String b) {
		return a + "***" + b;
	}
}

案例二: 判断员工表中工资的级别

package udf;

import org.apache.hadoop.hive.ql.exec.UDF;

/*
 * 	根据员工薪水判断员工级别
	(*) sal < 1000     ----> Grade A
	(*) 1000<=sal <3000 ---> Grade B
	(*) sal >=3000      ---> Grade C
*/

public class CheckSalaryGrade extends UDF {
	
	public String evaluate(String salary) {
		int sal = Integer.parseInt(salary);
		
		if (sal < 1000) {
			return "Grade A";
		} else if (sal >= 1000 && sal < 3000) {
			return "Grade B";
		} else {
			return "Grade C";
		}
	}
}

4、Hive自定义函数的部署

  • 把程序打包放到目标机器上去
  • 进入hive客户端,添加jar包:
hive> add jar /root/temp/udf.jar;
  • 创建临时函数:
hive> create temporary function myconcat as 'udf.MyConcatString';
hive> create temporary function checksal as 'udf.CheckSalaryGrade';

5、Hive自定义函数的调用

  • 查询HQL语句:
hive> select myconcat(ename,job) from emp;
hive> select ename,sal,checksalary(sal) from emp;
  • 销毁临时函数:
hive> DROP TEMPORARY FUNCTION checksalary;
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值