Hadoop系列 (五)：MapReduce详细介绍

最新推荐文章于 2024-08-10 16:30:06 发布

EricRae

最新推荐文章于 2024-08-10 16:30:06 发布

阅读量1.7k

点赞数 1

分类专栏： # hadoop 文章标签： hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/EricLeiy/article/details/120655680

版权

本文详细介绍了Hadoop MapReduce的概念、工作原理，包括MapReduce架构、执行过程，尤其是Map和Reduce任务的执行细节，以及Shuffle过程的Map端和Reduce端执行流程。通过对MapReduce的学习，读者可以深入了解大数据处理的关键步骤。

摘要由CSDN通过智能技术生成

文章目录

Hadoop系列文章

Hadoop(一)：在CentOS中搭建hadoop环境（伪分布式)

Hadoop(二)：完全分布式搭建（腾讯云服务器+阿里云服务器）

Hadoop系列 (三)：HDFS详细介绍

Hadoop系列 (四)：Yarn详细介绍

Hadoop系列 (五)：MapReduce详细介绍

Hadoop系列 (六)：Spark搭建

Hadoop系列 (七)：ZooKeeper详细介绍

MapReduce概念

Hadoop MapReduce是一个软件框架，基于该框架能够容易地编写应用程序，这些应用程序能够运行在由上千个商用机器组成的大集群上，并以一种可靠的，具有容错能力的方式并行地处理上TB级别的海量数据集。

MapReduce擅长处理大数据，思想就是分而治之。

Mapper负责“分”，即把复杂的任务分解为若干个简单的任务来处理：

缩小原任务的数据计算规模。
就近计算原则，任务会分配到存放着所需数据的节点上进行计算。
这些小任务可以并行计算，彼此间几乎没有依赖关系

Reducer负责对map阶段的结果进行汇总，Reducer个数，通过mapred-site.xml配置文件里设置参数mapred.reduce.tasks的值，默认值为1。

MapReduce工作原理

MapReduce这个术语来自两个基本的数据转换操作：map过程和reduce过程。

map过程：

即键值对的转换。map操作会将集合中的元素从一种形式转化成另一种形式，在这种情况下，输入的键值对会被转换成零到多个键值对输出。

reduce过程：

某个键的所有键值对都会被分发到同一个reduce操作中，也就是说，这个键和这个键所对应的所有值都会被传递给同一个Reducer。reduce过程的目的是将值的集合转换成一个值（例如求和或者求平均），或者转换成另一个集合。这个Reducer最终会产生一个键值对。

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

EricRae CSDN认证博客专家 CSDN认证企业博客

码龄7年

72: 原创

5万+: 周排名

137万+: 总排名

23万+: 访问

: 等级

1790: 积分

127: 粉丝

93: 获赞

54: 评论

565: 收藏

私信

关注

热门文章

分类专栏

大数据 1篇
hadoop 13篇
hive 10篇
基于python的大数据分析 13篇
Python 25篇
Oracle 8篇
Linux 18篇
随笔 8篇
docker 2篇
mysql 3篇
编程工具 5篇

最新评论

Oracle表空间使用及单表空间占用查询
CSDN-Ada助手: 非常感谢你分享的关于Oracle表空间使用及单表空间占用查询的技术文章。我觉得这篇博客对于想深入了解Oracle数据库管理的读者来说非常有用。下一篇博客你可以考虑写一篇关于Oracle数据库性能优化的文章，分享一些优化的经验和技巧，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
python 列表list初始化
tylk520: 写的什么垃圾 python3和python2混用
Oracle数据库恢复删除数据的方法
尾生先生: 大佬收我一拜。一百多万的项目数据，直接干没了，一身冷汗。看了您的文章，恢复了，感谢
ssh免密登录详细设置
EricRae: 先安装ssh服务然后都启动ssh 就可以了
ssh免密登录详细设置
weixin_52994082: ssh没有配置成功怎么互相发公式

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。