hadoop 自定义排序

最新推荐文章于 2021-11-10 20:38:28 发布

诚恳

最新推荐文章于 2021-11-10 20:38:28 发布

阅读量1k

点赞数

分类专栏： hadoop 文章标签： hadoop WritableComparable

本文链接：https://blog.csdn.net/fln250/article/details/23731251

版权

hadoop 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

hadoop 默认的排序机制是，通过key的hashCode进行升序排列，但是我们要降序或者通过value排序呢？那么我们就要进行自定义排序了

自定义排序需要注意几点：

1.默认通过hadoop的key值进行排序，那么说明我需要写一个自定义的类，当作key来进行排序

2.自定义的key值，需要实现WritableComparable<T>(它extends Writable和Comparable<T>)

3.重写compareTo(Object obj)这个方法

4.重写hashCode用来进行排序

static class NewK implements WritableComparable<NewK> {
	
			Long first;
			Long second;
	
			public NewK() {}
	
			public NewK(long first, long second) {
				this.first = first;
				this.second = second;
			}
	
			@Override
			public void readFields(DataInput in) throws IOException {
				// TODO Auto-generated method stub
				this.first = in.readLong();
				this.second = in.readLong();
			}
	
			@Override
			public void write(DataOutput out) throws IOException {
				// TODO Auto-generated method stub
				out.writeLong(this.first);
				out.writeLong(this.second);
			}
	
			@Override
			public int compareTo(NewK o) {
				// TODO Auto-generated method stub
				Long oFirst = o.first;
				long minus = this.first - oFirst;
				// 比较传进来的对象和现在的对象的大小，如果不相等，那么返回原来的值，否则第二个的值的大小进行排序
				if (minus != 0) {
					return (int) minus*-1;
				}
				return (int) (this.second - o.second)*-1;
			}
	
			@Override
			public int hashCode() {
				// TODO Auto-generated method stub
				return this.first.hashCode() + this.second.hashCode();
			}
	
			@Override
			public boolean equals(Object obj) {
				// TODO Auto-generated method stub
				NewK n = (NewK) obj;
				return this.first == n.first && this.second == n.second;
			}
		}

这里我们把first当作key

实现效果是：key降序排列，value降序排序

在compareTo()中我们看到，现在的对象和传进来的比较对象进行了key 的比较，如果他们不相等，那么他们将会按照原来的方式，进行升序排列，当我们×1后那么就会降序，如果他们相同，于是比较value,比较出大小后，默认是升序排列，当我们×1后，那么他们就是降序！