mapreduce分区

目录

 性别分区器 Partitioner的泛型kv类型是map阶段输出的kv类型

SexPartitioner

 

 Driver

   //7.设置自定义分区和reduce task的个数


案例
计算用户消费的总金额,根据用户的不同性别,将结果输出到不同的文件中

在之前的基础上添加

SexPartitioner

入口文件示例

 性别分区器
 Partitioner的泛型kv类型是map阶段输出的kv类型

SexPartitioner

package com.igeekhome.mapreduce.sale;

import com.igeekhome.mapreduce.model.UserSale;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;

/**
 * 性别分区器
 * Partitioner的泛型kv类型是map阶段输出的kv类型
 */
public class SexPartitioner extends Partitioner<Text, UserSale>{
    @Override
    public int getPartition(Text text, UserSale userSale, int i) {
        //获取用户的性别
        String sex = userSale.getSex();
        //设置分区号
        int partitionNum = 0;
        if (sex.equals("男")){
            partitionNum = 0;
        } else if (sex.equals("女")) {
            partitionNum = 1;
        }else{
            partitionNum = 2;
        }
    return partitionNum;
    }
}

 其中返回的0,1,2表示最终输出文件的

 

 Driver

package com.igeekhome.mapreduce.sale;

import com.igeekhome.mapreduce.model.UserSale;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

public class SaleDriver {
    public static void main(String[] args) throws IOException, InterruptedException, ClassNotFoundException {
        //1.获取配置对象和job对象
        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf);
        //2.设置Driver类对象
        job.setJarByClass(SaleDriver.class);
        //3.设置mapper和reducer类对象
        job.setMapperClass(SaleMapper.class);
        job.setReducerClass(SaleReducer.class);
        //4.设置map阶段输出的kv对象
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(UserSale.class);
        //5.设置最终输出的kv类对象
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(UserSale.class);
        //6.设置读取文件的路径 和 输出文件的路径
        FileInputFormat.setInputPaths(job,new Path("D:\\code\\sale_details (1).txt"));
        FileOutputFormat.setOutputPath(job,new Path("D:\\code\\output"));
 
  //7.设置自定义分区和reduce task的个数

        //7.设置自定义分区和reduce task的个数
        job.setPartitionerClass(SexPartitioner.class);
        job.setNumReduceTasks(3);

        //8.提交job
        boolean result = job.waitForCompletion(true);
        System.out.println(result?"计算成功":"计算失败");
    }

}

 

 计算结果

part-r-00000

 part-r-00001

 

 part-r-00002

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值