Hive的自定义查询函数

最新推荐文章于 2024-05-11 07:45:00 发布

pengjunzhen

最新推荐文章于 2024-05-11 07:45:00 发布

阅读量1.1k

点赞数

分类专栏： Hive 文章标签： Hive

本文链接：https://blog.csdn.net/Pengxiaozhen1111/article/details/87901810

版权

Hive 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

Hive的自定义查询函数

1. Hive的自定义函数（UDF）： User Defined Function
可以直接应用于select语句，对查询结构做格式化处理后，再输出内容。

2. Hive自定义函数的实现细节
自定义UDF需要继承org.apache.hadoop.hive.ql.UDF。
需要实现evaluate函数，evaluate函数支持重载。

3. Hive自定义函数案例
案例一：拼接两个字符串

package udf;

import org.apache.hadoop.hive.ql.exec.UDF;

public class MyConcatString extends UDF {

	/**
	 *   自定义的连接函数
	 * @param a
	 * @param b
	 * @return
	 */
	public String evaluate(String a, String b) {
		return a + "***" + b;
	}
}

案例二：判断员工表中工资的级别

package udf;

import org.apache.hadoop.hive.ql.exec.UDF;

/*
 * 	根据员工薪水判断员工级别
	(*) sal < 1000     ----> Grade A
	(*) 1000<=sal <3000 ---> Grade B
	(*) sal >=3000      ---> Grade C
*/

public class CheckSalaryGrade extends UDF {
	
	public String evaluate(String salary) {
		int sal = Integer.parseInt(salary);
		
		if (sal < 1000) {
			return "Grade A";
		} else if (sal >= 1000 && sal < 3000) {
			return "Grade B";
		} else {
			return "Grade C";
		}
	}
}

4、Hive自定义函数的部署

把程序打包放到目标机器上去
进入hive客户端，添加jar包：

hive> add jar /root/temp/udf.jar;

创建临时函数：

hive> create temporary function myconcat as 'udf.MyConcatString';
hive> create temporary function checksal as 'udf.CheckSalaryGrade';

5、Hive自定义函数的调用

查询HQL语句：

hive> select myconcat(ename,job) from emp;
hive> select ename,sal,checksalary(sal) from emp;

销毁临时函数：

hive> DROP TEMPORARY FUNCTION checksalary;

pengjunzhen

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录