MapReduce统计TopN示例

博客内容介绍了如何使用MapReduce分别统计年、月、日的最高气温,并强调了默认Text排序的适用性。在处理并列TopN情况时,提出了自定义比较器的解决方案,通过封装类和TreeSet在reduce阶段进行TopN统计,同时注意在数据有限时的特殊情况。此外,还提到了combiner在提高效率方面的作用。
摘要由CSDN通过智能技术生成

分别统计年、月、日最高气温(实现排序)

package mr.temp;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.DoubleWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

import java.io.IOException;

public class TopTemp {
    static class MyMapper extends Mapper<LongWritableTextTextDoubleWritable> {
        Text outKey new Text();
        DoubleWritable outValue new DoubleWritable();

        @Override
        protected void map(LongWritable keyText valueContext context) throws IOExceptionInterruptedException {
            try {
                String[] datas = value.toString().split("\t");
                outValue.set(Double.valueOf(datas[1]));
                outKey.set(datas[0].substring(010));//按照天进行统计最高气温
                context.write(outKeyoutValue);
                outKey.set(datas[0].substring(07));//按照月进行统计最高气温

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值