hadoop入门（九）Mapreduce中的简单排序（手机流量排序）

最新推荐文章于 2024-04-17 16:49:54 发布

YUNFLY_

最新推荐文章于 2024-04-17 16:49:54 发布

阅读量2.2k

点赞数

分类专栏：大数据文章标签： mapreduce hadoop hdfs 集群大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangyunfeixyz/article/details/78072436

版权

本文介绍了如何使用Hadoop MapReduce处理日志数据，实现手机流量信息的汇总与排序。通过自定义Bean和Mapper，根据总流量进行倒序排序，最后在Reducer中调整输出格式，使得结果按总流量降序排列。

摘要由CSDN通过智能技术生成

需求：

对日志数据中的上下行流量信息汇总，并输出按照总流量倒序排序的结果

数据如下：电话号-上行流量-下行流量（下面是模拟的数据）

13823434356 20 30
15844021203 30 40
18688788797 40 50
15844939284 50 60
17646566767 90 70
18688988989 10 20
11385768543 40 44

分析：

基本思路：实现自定义的bean来封装流量信息，并将bean作为map输出的key来传输

MR程序在处理数据的过程中会对数据排序(map输出的kv对传输到reduce之前，会排序)，排序的依据是map输出的key

所以，我们如果要实现自己需要的排序规则，则可以考虑将排序因素放到key中，让key实现接口：WritableComparable

然后重写key的compareTo方法。

最后在reduce中把传入的maperr处理好的数据的key,value进行调换，这样输出结果就是手机号在前，其他的在后了。

实现：

1、eclipes程序，准备环境（略）：

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

YUNFLY_ CSDN认证博客专家 CSDN认证企业博客

码龄13年

36: 原创

10万+: 周排名

65万+: 总排名

10万+: 访问

: 等级

1260: 积分

73: 粉丝

82: 获赞

37: 评论

210: 收藏

私信

关注

热门文章

分类专栏

区块链 4篇
Linux 2篇
生活 1篇
算法 1篇
机器学习 2篇
javaDemo 11篇
大数据 14篇
数据库 1篇

最新评论

在职老程序员考非全211硕士（计算机专业）经验
码小鹿: 毕业就能考吗？我看网上都是说需要毕业满三年什么的
在职老程序员考非全211硕士（计算机专业）经验
YUNFLY_: 在职，年纪小可以辞职。看个人情况。
在职老程序员考非全211硕士（计算机专业）经验
YUNFLY_: 计算机非全相对来说还是可以的，除了个别GQ,大厂很多都没问题，算法也是可以的，关键看你水平，我很多非全同学有读博的，有拿户口的，大厂的都有，不要因为个别声音和个别偏见，影响你的判断，含金量只是一方面，提升自己才是关键。
并行算法：均匀划分（PSRS）和方根划分（SIMD-CREW）
Aureole1210: 均匀划分的全局交换第一段是不是写错了，第一段最后的元素应该是6吧
在职老程序员考非全211硕士（计算机专业）经验
白橙子1: 贴主好，我想问下非全的含金量如何，如果是单纯的想提升学历又不想放弃手头的offer是不是可以去试试？那如果想从开发转到算法类的岗位这个非全学历够吗？非全大厂之类的认吗？老哥的非全考来是有什么用途和打算可以讲下吗？主要有几点疑问想请教下前辈。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。