MapReduce编程模型

鳳舞酒天

于 2023-08-12 13:39:27 发布

阅读量147

点赞数

分类专栏： big data 文章标签： mapreduce 大数据

原文链接：https://www.itheima.com/news/20201217/113617.html

版权

big data 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

MapReduce是一种编程模型，用于处理大规模数据集的并行运算。使用MapReduce执行计算任务的时候，每个任务的执行过程都会被分为两个阶段，分别是Map和Reduce，其中Map阶段用于对原始数据进行处理，Reduce阶段用于对Map阶段的结果进行汇总，得到最终结果，这两个阶段的模型如图1所示。

　图1 MapReduce简易模型

　　MapReduce编程模型借鉴了函数式程序设计语言的设计思想，其程序实现过程是通过map()和reduce()函数来完成的。从数据格式上来看，map()函数接收的数据格式是键值对，产生的输出结果也是键值对形式，reduce()函数会将map()函数输出的键值对作为输入，把相同key值的value进行汇总，输出新的键值对。接下来，通过一张图来描述MapReduce的简易数据流模型，具体如图2所示。

　　图2 MapReduce简易数据流模型

　　关于图2描述的MapReduce简易数据流模型的相关说明，具体如下：

　　 (1)将原始数据处理成键值对形式。

　　 (2)将解析后的键值对传给map()函数，map()函数会根据映射规则，将键值对映射为一系列中间结果形式的键值对。

　　 (3)将中间形式的键值对形成形式传给reduce()函数处理，把具有相同key的value合并在一起，产生新的键值对，此时的键值对就是最终输出的结果。

　　这里需要说明的是，对于某些任务来说，可能不一定需要Reduce过程，也就是说，MapReduce的数据流模型可能只有Map过程，由Map产生的数据直接被写入HDFS中。但是，对于大多数任务来说，都是需要Reduce过程的，并且可能由于任务繁重，需要设定多个Reduce，例如，下面是一个具有多个Map和Reduce的MapReduce模型，具体如图3所示。

图3 多个Map和Reduce的MapReduce模型

　　图3演示的是含有3个Map和2个Reduce的MapReduce程序，其中，由Map产生的相关key的输出都会集中到Reduce中处理，而Reduce是最后的处理过程，其结果不会进行第二次汇总。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
MapReduce编程模型

详解MapReduce编程的Map模型和Reduce模型
复制链接

扫一扫

专栏目录

鳳舞酒天 CSDN认证博客专家 CSDN认证企业博客

码龄7年

20: 原创

13万+: 周排名

23万+: 总排名

7万+: 访问

: 等级

357: 积分

453: 粉丝

30: 获赞

6: 评论

148: 收藏

私信

关注

热门文章

分类专栏

Linux 2篇
web 13篇
big data 1篇
software engineering 1篇
Python 6篇
OAuth2.0 1篇
VCS 1篇
线程安全 1篇
第三方登录 1篇
JAVA基础 2篇
Data mining 1篇
ide 2篇
test 4篇

最新评论

Web Application集成Google第三方登录(2022最新)
鳳舞酒天: 当 Google 登录 API 出现 403 错误时，通常表示您的请求被服务器拒绝了。这可能是由于权限问题、身份验证失败或其他原因引起的. 你需要检查检查 OAuth 客户端 ID 和密钥, 以及api配额
如何在Ubuntu中完全移除Snap
鳳舞酒天: ChatGPT 禁用了 Snap 应用并不会影响 Ubuntu 系统的更新。当你从 Ubuntu 24.04 更新到 24.04.1 时，系统会自动应用所有的更新，包括针对系统本身的更新，不会受到 Snap 应用是否启用的影响。
如何在Ubuntu中完全移除Snap
TungChia-hui: 请问禁用了snap，如果以后我要从24.04更新到24.04.1，会有问题吗
Web Application集成Google第三方登录(2022最新)
weixin_39324533: 禁止访问：“Web 客服端”尚未完成 Google 验证流程 735668276@qq.com “Web 客服端”尚未完成 Google 验证流程。此应用正在测试中，仅供已获开发者批准的测试人员使用。如果您认为自己应有权使用，请联系开发者。如果您是“Web 客服端”的开发者，请参阅错误详情。错误 403： access_denied 这个问题怎么解决
Python注意事项(五)
彼方: 好文，收藏学习了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。