Hadoop ——mapreduce——partitioner 理解

partitioner是在mapreduce的map过程之后,将mapper输出文件分成几个文件,再交由reducer处理。

之前老以为是在reducer阶段进行的partitioner,所以导致自己写了分区类,有了不同的文件输出,但是输出文件中的其中一个文件什么都没有。

 

code:

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;


/**
 * @Description: 实现分别输出到不同的文件
 * @Date:2018-10-19
 */

public class MyPartitoner extends Partitioner<Text, IntWritable> {

    public int getPartition (Text key, IntWritable values, int numPartioner) throws IndexOutOfBoundsException{
        //int i = Integer.parseInt(values.toString());
        //int a = i % numPartioner;
        String str = key.toString();
        char ch = str.charAt(0);
        switch (ch){
            case 'a' :
                return 0;
            case 'b' :
                return 1;
            default:
                return 2;
        }
    }
}

 

这是一个wordcount程序,改写之后,会出现三个分区文件,一个文件里面只存放统计了a的次数记录。一个文件里面只存放统计b的次数记录,第三个文件就存放统计其他字符的次数记录。

主函数设置:

Information:你要生成几个输出文件,就需要设置多少个NumReduceTasks

再贴一个partitoner的源码:

重写自己的partitioner的时候就需要重写getPartition方法,这是一个抽象方法,继承Partitioner类的时候,必须给他实现。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值