全排序的实现方法

最新推荐文章于 2023-05-19 01:46:57 发布

duzewen

最新推荐文章于 2023-05-19 01:46:57 发布

阅读量340

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duzewen/article/details/64919140

版权

有三种方法：

1.定义1个reduce

2.自定义分区函数.

自行设置分解区间。

3.使用hadoop采样机制。

通过采样器生成分区文件，结合hadoop的TotalOrderPartitioner进行分区划分。
TotalOrderPartitioner //全排序分区类,读取外部生成的分区文件确定区间。

使用时采样代码在最后端,否则会出现错误。

//分区文件设置，设置的job的配置对象，不要是之前的conf.
TotalOrderPartitioner.setPartitionFile(job.getConfiguration(),new Path("d:/mr/par.lst"));

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
全排序的实现方法

有三种方法：1.定义1个reduce 2.自定义分区函数. 自行设置分解区间。 3.使用hadoop采样机制。通过采样器生成分区文件，结合hadoop的TotalOrderPartitioner进行分区划分。 TotalOrderPartitioner //全排序分区类,读取外部生成的分区文件确定区间。使用时采样代码在最
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。