[MapReduce_8] MapReduce 中的自定义分区实现


 

0. 说明

  设置分区数量 && 编写自定义分区代码

 

 


 

1. 设置分区数量

  分区(Partition)

  分区决定了指定的 Key 进入到哪个 Reduce 中

  分区目的:把相同的 Key 发送给同一个 Reduce


  默认 hash 分区,算法

// 返回的分区号
(key.hashCode() & Integer.MAX_VALUE) % numReduceTasks

 

  设置分区数

job.setNumReduceTasks(3);

 


 2. 代码编写

  在 [MapReduce_1] 运行 Word Count 示例程序 代码基础之上进行以下操作

  实现将文本中的数字存放在分区0,数字之外的内容放置到分区1

  【2.1 编写 MyPartition.java】

package hadoop.mr.partition;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;


/**
 * MapReduce 自定义分区
 */
public class MyPartition extends Partitioner<Text, IntWritable> {
    /**
     * 自定义分区将数字放在0号分区,其余放在1号分区
     */
    @Override
    public int getPartition(Text key, IntWritable value, int numPartitions) {
        try {
            Integer.parseInt(key.toString());
            return 0;
        } catch (Exception e) {
            return 1;
        }
    }
}

 

  【2.2 修改 WCApp.java】

   

 

  【2.3 最终结果】

      

 

 

 

 


 

转载于:https://www.cnblogs.com/share23/p/9779593.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值