hadoop--mapreduce排序

博客介绍了如何使用MapReduce实现特定的排序需求。默认的MapReduce排序仅按key升序,为达到第一列和第二列复合排序,文章创建了自定义类型SortTypeWritable,实现了WritableComparable接口并重写compareTo()方法,确保在相同第一列的情况下,按第二列升序排列。
摘要由CSDN通过智能技术生成
我们知道mapper端的分组排序都是根据key的,我们通过几个实例来体现。

#首先按照第一列升序排列,当第一列相同时,第二列升序排列

#当第一列相同时,求出第二列的最小值



一、使用mapreduce默认的排序算法

使用MapReduce默认排序算法代码如下所示,在代码中我将第一列作为键,第二列作为值。

package com.yc.hadoop.mapreduce.demo02;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;


public class TwoSortDemo {
	public static void main(String[] args) throws Exception {
		if(args.length < 2){
			throw new RuntimeException("参数个数不对,至少需要两个参数");
		}
		Configuration conf = new Configuration();
		Job job = Job.getInstance(conf,"TwoSortDemo");
		job.setJarByClass(TwoSortDemo.class);		
		
		job.setInputFormatClass(MyTextInputFormat.class);	
		
		
		job.setMapperClass(TwoSortMapper02.class);
		job.setMapOutputKeyClass(IntWritable.class);
		job.setMapOutputValueClass(IntWritable.class);
		
		//job.setReducerClass(TwoSortReduce.class);  //集群合并
		
		
		//输入文件操作
		Path[] inPaths = new Path[args.leng
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值