hive 的udf(user defined function)自定义函数
1.新建java maven 项目
2.pom.xml 中引入
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>2.7.4</version>
</dependency>
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-exec</artifactId>
<version>1.2.1</version>
</dependency>
3.写一个 java 类,继承 UDF,并重载 evaluate 方法【注意:udf类中并没有evaluate()方法,hive的内部机制会自动调用 evaluate()方法;同时自己创建的java类中可以定义多个evaluate()方法 如: public Text evaluate(Text s) {} public String evaluate(int end){}】【重写的evaluate()方法必须有返回值 不能用void修饰】
4.需求:定义一个自定义函数 将大写转换成小写 代码如下:
package cn.hive;
imp

本文介绍了如何在Hive中创建自定义UDF,包括从创建Java Maven项目、编写Java类到打包、添加到Hive classpath的过程。示例包括将字符串转为小写及生成数字范围列表的功能。此外,文章还讨论了UDF的核心——evaluate方法的重要性及其使用注意事项。
最低0.47元/天 解锁文章
1182

被折叠的 条评论
为什么被折叠?



