MR高级-规约002

最新推荐文章于 2024-07-19 15:36:42 发布

路上^_^

最新推荐文章于 2024-07-19 15:36:42 发布

阅读量130

点赞数

分类专栏：大数据文章标签： hadoop

本文链接：https://blog.csdn.net/DXH9701/article/details/120105962

版权

大数据专栏收录该内容

20 篇文章 0 订阅

订阅专栏

文章目录

概述
思路
- 代码

概述

Combiner 是在map端,对map端的输出做一次合并.
减少map和reduce 节点之间的数据传输量.

是 Reduce 的子组件

在这里插入图片描述
是在每个 MapTask之后,将map 方法要输出的数据进行合并.
将相同 key 的数据合并

思路

写两个 reduce. 都继承 reduce
只不过在 job中将其中一个 reduce 设置为 Combiner

代码

public class MyCombiner extends Reducer<Text, LongWritable,Text,LongWritable> {

    @Override
    protected void reduce(Text key, Iterable<LongWritable> values, Context context) throws IOException, InterruptedException {
        Long count = 0L;
        for (LongWritable value : values) {
            count += value.get();
        }
        context.write(key,new LongWritable(count));
    }

}

public class JobMainCombiner extends Configured implements Tool {

    public static void main(String[] args) throws Exception {

        Configuration configuration = new Configuration();
        int status = ToolRunner.run(configuration, new JobMainCombiner(), args);
        System.out.println("任务运行状态是 :: "+status);

    }

    @Override
    public int run(String[] strings) throws Exception {

        Job job = Job.getInstance(super.getConf(), "JobCombiner");

        // 设置在集群环境下运行
        job.setJarByClass(JobMainCombiner.class);

        // 设置读取的路径
        job.setInputFormatClass(TextInputFormat.class);
        TextInputFormat.addInputPath(job,new Path("/suibian"));

        // mapper
        job.setMapperClass(combinerMapper.class);
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(LongWritable.class);

        // 设置 shuffle 规约
        job.setCombinerClass(MyCombiner.class);

        // 设置 reduce
        job.setReducerClass(combinerReduce.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(LongWritable.class);

        job.setOutputFormatClass(TextOutputFormat.class);
        TextOutputFormat.setOutputPath(job,new Path("/suibian"));

        return job.waitForCompletion(true) ? 0 : 1;
    }

}

路上^_^

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MR高级-规约002

文章目录概述思路代码概述Combiner 是在map端,对map端的输出做一次合并.减少map和reduce 节点之间的数据传输量.是 Reduce 的子组件是在每个 MapTask之后,将map 方法要输出的数据进行合并.将相同 key 的数据合并思路写两个 reduce. 都继承 reduce只不过在 job中将其中一个 reduce 设置为 Combiner代码public class MyCombiner extends Reducer<Text, LongWritab
复制链接

扫一扫