Shuffle过程中重要的WritableComparable排序入门

随缘zzz

于 2020-05-29 11:17:49 发布

阅读量136

点赞数

分类专栏： shuffle 入门 WritableComparable排序文章标签： hadoop

本文链接：https://blog.csdn.net/weixin_44122269/article/details/106421735

版权

入门同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

shuffle

4 篇文章 0 订阅

订阅专栏

WritableComparable排序

1 篇文章 0 订阅

订阅专栏

WritableComparable排序

MapTask和ReduceTask均会对数据按照key进行排序，改操作属于hadoop的默认行为，
任何应用程序中的数据均会被排序，而不管逻辑上是否需要。
默认排序按照字典顺序排序，且实现该排序的方法是快速排序。

自定义排序WritableComparable
当bean对象作为key传输，需要实现WritableComparable接口

序列化过程：

//反序列化
 @Override
 public void readFields(DataInput in) throws IOException {
  // TODO Auto-generated method stub
  upFlow = in.readLong();
  downFlow = in.readLong();
  sumFlow = in.readLong();
 }
 
 //序列化
 @Override
 public void write(DataOutput out) throws IOException {
  out.writeLong(upFlow);
  out.writeLong(downFlow);
  out.writeLong(sumFlow);
  
 }

需要注意的是，序列化与反序列化是一个队列，所以要保证序列化与反序列化传来的值需要顺序一致。

重写compareTo方法实现倒序排序

 public int compareTo(FlowBean bean) {
  // TODO Auto-generated method stub
  int result;
  if(sumFlow > bean.getSumFlow()) {
   result = -1;
  }else if(sumFlow < bean.getSumFlow()) {
   result = 1;
  }else {
   result = 0;
  }
  
  return result;
  }

升序排序
自身值>传来的值
1
自身值<传来的值
-1

降序排序
自身值>传来的值
-1
自身值<传来的值
1

随缘zzz

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Shuffle过程中重要的WritableComparable排序入门

WritableComparable排序MapTask和ReduceTask均会对数据按照key进行排序，改操作属于hadoop的默认行为，任何应用程序中的数据均会被排序，而不管逻辑上是否需要。默认排序按照字典顺序排序，且实现该排序的方法是快速排序。自定义排序WritableComparable当bean对象作为key传输，需要实现WritableComparable接口序列化过程：//反序列化 @Override public void readFields(DataInput in)
复制链接

扫一扫

专栏目录