HADOOP IO详解——Partitioner分区

最新推荐文章于 2022-07-09 10:30:00 发布

中小学生

最新推荐文章于 2022-07-09 10:30:00 发布

阅读量204

点赞数

文章标签： Partitioner HashPartitioner hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26449287/article/details/82706207

版权

package org.apache.hadoop.mapred;

import org.apache.hadoop.classification.InterfaceAudience;
import org.apache.hadoop.classification.InterfaceStability;
public interface Partitioner<K2, V2> extends JobConfigurable {
//这里面就一个方法实现分区
int getPartition(K2 key, V2 value, int numPartitions);
}
//默认的分区是hash分区

//下面是hash分区的源码

package org.apache.hadoop.mapred.lib;

import org.apache.hadoop.classification.InterfaceAudience;
import org.apache.hadoop.classification.InterfaceStability;
import org.apache.hadoop.mapred.Partitioner;
import org.apache.hadoop.mapred.JobConf;

//hash分区实现Partitioner接口重写里面的getPartition

public class HashPartitioner<K2, V2> implements Partitioner<K2, V2> {

public void configure(JobConf job) {}

public int getPartition(K2 key, V2 value,
int numReduceTasks) {

//key.hashCode然后就能实现相同的key进入同一个reduce，&Integer.MAX_VALUE是为了防止key.hashCode

//出现负数的情况 &表示按位与运算（相同为1不同为0）
return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;
}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HADOOP IO详解——Partitioner分区

package org.apache.hadoop.mapred;import org.apache.hadoop.classification.InterfaceAudience;import org.apache.hadoop.classification.InterfaceStability;public interface Partitioner&lt;K2, V2&gt; ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。