Hive中自定义函数UDF、UDTF函数介绍

本文介绍了Hive中的自定义函数,包括UDF(一进一出)和UDTF(一进多出)的分类及实现案例。详细阐述了UDF的编写过程,从继承UDF类到在Hive环境中注册和使用。同时,也对UDTF的使用场景进行了说明,并给出了UDTF的实现步骤。
摘要由CSDN通过智能技术生成

1、自定义函数的分类

  • UDF:一进一出 (例:你输入多少行就给你返回多少行)
  • UDTF:一进多出 (例:你输入一行数据给你返回多行)
  • UDAF:多进一出

2、UDF案例实现

在这里插入图片描述
分析:上面的需求是一进一出的场景,所以我们需要编写UDF自定义函数。

  • 代码实现
    (1) 继承org.apache.hadoop.hive.ql.exec.UDF,在里面实现 evaluate方法,在 evaluate 方法中实现自己的逻辑。
package com.shujia.function_hive;
import org.apache.hadoop.hive.ql.exec.UDF;

public class MyUdf extends UDF {
   
	//实现evaluate方法
	public String evaluate(String col){
   
	// 张三 ==》 #张三$
	String s = "#"+col+"$";
	return s;
	}
}

(2) 将我们写好代码打包上传Linux 虚拟机
(3) 在 hive shell 中,使用 add jar 路径将 jar 包作为资源添加到 hive 环境中

hive (shuangqian)> add jar /usr/local/soft/data/shuangqian-1.0-SNAPSHOT.jar;

(4) 注册临时函数 fxxxl是你起得函数名,myudf:是我们的类名

hive (shuangqian)> create temporary function fxxxl as 'com.shujia.function_hive.MyUdf';

(5) 使用这个函数

select fxxxl(name) from student limit 10;

(6) 使用函数名处理数据

select fxx1(name) as fxx_name from students limit 10;
#施笑槐$
#吕金鹏$
#单乐蕊$
#葛德曜$
#宣谷芹$
#边昂雄$
#尚孤风$
#符半双$
#沈德昌$
#羿彦昌$

3、UDTF案例实现

(1) 需求

hive(default)> select myudtf("hello,world,hadoop,hive", ",");
hello
world
hadoop
hive

(2) 自定义UDTF函数实现案例一

package com.shujia.function_hive;

import org.apache.hadoop.hive.ql.exec.UDFArgumentException;
import org.apache.hadoop.hive.ql.metadata.HiveException;
import org.apache.hadoop.hive.ql.udf.generic.GenericUDTF;
import 
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值