mr之reduce端groupingcomparator

最新推荐文章于 2021-08-29 17:17:16 发布

AuroraPetard

最新推荐文章于 2021-08-29 17:17:16 发布

阅读量251

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/qq_38250124/article/details/79897363

版权

hadoop 专栏收录该内容

38 篇文章 0 订阅

订阅专栏

在分片进入reduce之前可以通过groupingcomparator自定义为相同的一组key

常用在使具有相同的id号的bean看做相同的key，即一个bean是一个对象，默认情况下reduce认为一个bean就是一组

首先需要定义一个类来extendswritablecomparator，最后在main方法中

job.setgroupingcomparator()

package com.lq.bd;

import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.io.WritableComparator;

//利用reduce端的groupingcomparat来将一组bean看成相同的key
//通过继承writableComparator来实现
 public class groupingcomparat extends WritableComparator {
    //不能少构造方法
    public groupingcomparat() {
        //注册传入reduce端的bean
        super(OrderBean.class,true);
    }

    @Override
    public int compare(WritableComparable a, WritableComparable b) {
        OrderBean abean= (OrderBean) a; //强转
        OrderBean bbean= (OrderBean) b;
        return abean.getItemid().compareTo(bbean.getItemid());//比较id是否相同，若相同则视作一组
 }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AuroraPetard

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mr之reduce端groupingcomparator

在分片进入reduce之前可以通过groupingcomparator自定义为相同的一组key常用在使具有相同的id号的bean看做相同的key，即一个bean是一个对象，默认情况下reduce认为一个bean就是一组首先需要定义一个类来extendswritablecomparator，最后在main方法中job.setgroupingcomparator()packag
复制链接

扫一扫