MapReduce应用案例2：简单数据排序

最新推荐文章于 2021-08-06 08:58:22 发布

机器熊技术大杂烩

最新推荐文章于 2021-08-06 08:58:22 发布

阅读量612

点赞数

分类专栏： MapReduce Hadoop MapReduce系列文章文章标签：数据排序

本文链接：https://blog.csdn.net/majianxiong_lzu/article/details/89035974

版权

1.需求描述

针对简单数据的排序需求并不复杂，大数据量文本中每行只存在一个数值，要求按照数值大小输出，且为数值标记行数。本案例对理解MR的原理深有帮助。
输入

输出

2.实现思路

MapReduce的Reduce阶段会按照key-velue对中的key进行排序，如果key为封装int的IntWritable类型，那么MapReduce按照数字大小对key排序，如果key为封装为String的Text类型，那么MapReduce按照字典顺序对字符串排序。

3.代码实现

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOEx

最低0.47元/天解锁文章

机器熊技术大杂烩

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
MapReduce应用案例2：简单数据排序

1.需求描述针对简单数据的排序需求并不复杂，大数据量文本中每行只存在一个数值，要求按照数值大小输出，且为数值标记行数。本案例对理解MR的原理深有帮助。输入12581283459...输出1 92 123 454 585 1283...2.实现思路MapReduce的Reduce阶段会按照key-velue对中的key进行排序，如果key为封装int...
复制链接

扫一扫