hive udaf_Hive的UDF和UDAF编程实例

最新推荐文章于 2024-06-12 13:57:58 发布

嘉丽丽

最新推荐文章于 2024-06-12 13:57:58 发布

阅读量192

点赞数

文章标签： hive udaf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33286064/article/details/112821447

版权

本文介绍了如何在Hive中编写UDF（用户自定义函数）和UDAF（用户自定义聚合函数）。通过示例详细展示了如何创建一个用于转换字符串大小写的UDF `lower_Or_UpperCase`，以及实现计算几何平均数的UDAF `GeometricMean`。从工程构建到Hive环境中的函数应用，包括jar包导入、临时函数创建和销毁等步骤。

摘要由CSDN通过智能技术生成

1.UDF

UDF类必须继承org.apache.hadoop.hive.ql.exec.UDF类，并且实现evaluate方法

1.建立工程

2.导入hive和hadoop的jar包

3.编写代码

public class lower_Or_UpperCase extends UDF

{

//实现至少一个evaluate方法

public Text evaluate(Text t,String up_or_lower)

{

if(t==null)

{

return null;

}

//依据标识的参数转换大小写

else if(up_or_lower.equals("lowercase"))

{

return new Text(t.toString().toLowerCase());

}

else if(up_or_lower.equals("uppercase"))

{

return new Text(t.toString().toUpperCase())

}

else

{

return null;

}

}

}

4.检查代码无误后打成jar包，名字为uporlower.jar,放置到/home/dengpeng下

5.进入Hive的shell，用add jar命令把jar包导入到Hive的环境变量下，用create temporary function as命令基于jar包中的类创建临时的函数，之后就可以在查询中使用函数了

hive>add jar /home/dengpeng/uporlower.jar

hive>create temporary function uporlower as 'com.cstore.lower_Or_UpperCase';

6.最后可以把不再需要的函数进行销毁

hive>drop temporary funtion uporlower;

2.UDAF

UDAF类必须继承自org.apache.hadoop.hive.ql.exec.UDAF类，并且实现接口org.apache.hadoop.hive.ql.exec.UDAFEvaluator;

接口有5个方法：init iterate terminatePartial merge terminate

public class GeometricMean extends UDAF

{

public static class midResult

{

public long numCount;

public double multSum;

}

public static class GMEvaluator implements UDAFEvaluator

{

midResult midr;

public GMEvaluator()

{

super();

midr = new minResult();

init();

}

public void init()//对中间结果实现初始化

{

midr.multSum = 1;

midr.numCount = 0;

}

public boolean iterate(IntWritable a)//接受传入的参数，并进行内部的轮转

{

if(a!=null)

{

midr.multSum*=a.get();

midr.numCount++;

}

return true;

}

public midResult terminatePartial()//负责返回iterate函数轮转后的数据

{

return midr.numCount==0?null:midr;

}

public boolean merge(midResult b)//接受terminatePartial的返回结果，合并接受的中间值

{

if(b!=null)

{

midr.numCount*=b.numCount;

midr.nultSum+=b.multSum;

}

return true;

}

public Double terminate()//返回最终的结果

{

return midr.numCount==0?null:Math.pow(midr.multSum,1.0/midr.numCount);

}

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。