pig的UDF函数的使用

最新推荐文章于 2021-02-19 03:29:01 发布

zhangbaoming815

最新推荐文章于 2021-02-19 03:29:01 发布

阅读量176

点赞数

分类专栏： hadoop 文章标签： pig UDF函数 pig用户自定义函数 pig user define function

本文链接：https://blog.csdn.net/zhangbaoming815/article/details/84249917

版权

hadoop 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

在 pig 中使用 UDF 函数：

1 ，编写 UDF 函数：

import java.io.IOException;

import org.apache.pig.FilterFunc;
import org.apache.pig.data.Tuple;

public class IsGoodQuality extends FilterFunc{

	@Override
	public Boolean exec(Tuple tuple) throws IOException {
		if(tuple == null || tuple.size() == 0) {
			return false;
		}
		
		Object object = tuple.get(0);
		if(object == null) {
			return false;
		}
		int i = (Integer) object;
		return i == 1;
	}
}

2. 将 UDF 函数打包成 jar 包

3. 告诉 pig 这个 jar 包的信息：

4. 使用这个函数：

filter_records =filter records by com.jdbc.IsGoodQuality(quality);

5. 查看结果：

dump filter_records;

6. 为自己写的 UDF 函数定义别名：

define IsGood com.jdbc.IsGoodQuality();

这里为自己写的 IsGoodQuality() 起别名为 IsGood;

7. 使用重新命令的函数：

filtered_records =filter records by IsGood(quality);

8. 查看效果：

dump filtered_records;

zhangbaoming815

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pig的UDF函数的使用

&lt;!-- @page { margin: 0.79in } P { margin-bottom: 0.08in } A:link { so-language: zxx } --&gt; 在pig中使用UDF函数：1，编写UDF函数： im...
复制链接

扫一扫

专栏目录