mr自定义排序和分类

一、上文的补充

  1、setup方法一般是用来初始化和加载资源的,主要也是因为编写mr程序所使用jvm和跑mr所使用的jvm并不是同一个,它们之间数据也不能共享,所以需要在setup里进行load。

  2、上文提到了可以自定义类型,当你需要使用这个自定义类型来做key时,你可以指定一个Comparator,当然也可以是自定义的Comparator。

  例如:

  public class MyKey implements WritableComparable<MyKey> {

    ...

    static {
      WritableComparator.define(MyKey.class, new MyComparator());
    }

  }

  3、在shuffle阶段是如何进行分组的?默认分组是通过key的值来进行比较的,也就是equals方法,当我们自定义key的时候,并需要按照key中某个属性来进行分组时,就需要实现自定义分组,并通过setGroupingComparatorClass来进行设置。

  4、protected void reduce(MyKey key,Iterable<MyValue> values,Context context),其中MyKey由key1和key2组成,分组时按照key1进行分组。在分组完成后进入reduce方法后,是由key来找寻value,还是由value来寻找key呢,我猜测是后者(没看源码不能保证)。所以我们在遍历values时,每个value可能对应不同的key。

二、自定义排序和分组

  自定义排序和分组都是继承WritableComparator,并重写compare方法,只不过设置时一个是在自定义key时来进行注册(WritableComparator.define),一个是run里来设置(setGroupingComparatorClass)

 

转载于:https://www.cnblogs.com/java-meng/p/11213226.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值