Mapreduce

最新推荐文章于 2024-09-15 22:31:42 发布

hanserfans

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量144

点赞数

分类专栏：学习笔记文章标签： mapreduce python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hanserfans/article/details/128475496

版权

学习笔记专栏收录该内容

18 篇文章 0 订阅

订阅专栏

什么是Map reduce

1.Map reduce是根据google的一篇论文提出的计算模型：Maoreduce（Hadoop实现了这种计算模型）
2.Mapreduce的诞生是为了解决pageranke（网页排名：排名的先后）问题而产生的计算模型

在这里插入图片描述
上图的网页关系就是我们的PageRank问题，通过谷歌的向量矩阵可以快速算出个个网页的重要度排名。矩阵当中的1代表着两个网页之间存在联系，0代表着网页之间不存在联系。通过计算网页在矩阵当中的权重来解决Pangaea的问题。mapreduce就是为了解决大量的网页之间的权重计算问题。
3.Map reduce的解决思想：先拆分，在合并。通过将大量的数据进行拆分运算矩阵权重，再将所得结果进行合并得出最终的结果从而做到计算大量数据。
4.举例：通过使用Map reduce的计算方法进行解决。下面是Map reduce的工作原理。请添加图片描述

MapReduce的数据处理流程

Inputformat会将切片中每一行的数据表达成kv形式,k是这一行数据的偏移量(longwritable),v是每一行数据内容类型(text)
map端会将每一行的数据进行处理,生成若干对kv作为中间结果,经过hashpartition分区后进入环形缓冲区,当环形缓存区满80%后会将数据溢写磁盘(这里会有溢写文件的合并叫做merge)
然后reduce端通过http的形式请求task tracker获取map task输出的文件,reduce端接收到数据后会进行一系列的合并,排序操作然后输出最终结果.

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hanserfans CSDN认证博客专家 CSDN认证企业博客

码龄2年

26: 原创

137万+: 周排名

19万+: 总排名

9683: 访问

: 等级

321: 积分

43: 粉丝

58: 获赞

8: 评论

57: 收藏

私信

关注

热门文章

分类专栏

学习笔记 18篇

最新评论

MySQL数据库之SELECT语句2.0
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
MySQL数据库学习基础之DBeaver下载与安装
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“MySQL数据库学习基础之DBeaver下载与安装”非常吸引人。通过您的分享，我对DBeaver的下载与安装有了更清晰的了解。值得称赞的是，您的博客内容简洁明了，让我在短时间内掌握了相关知识。希望您能继续保持创作，分享更多有关MySQL数据库学习的内容。我期待着您的下一篇博客，能否考虑分享一些实际应用场景中的技巧或者案例呢？这样可以帮助读者更好地理解MySQL数据库的应用，并提升我们的实际操作能力。再次恭喜您，并期待您的精彩创作！
Shell学习笔记（4）Shell编程之条件判断if命令详解
CSDN-Ada助手: 恭喜您写下了第15篇博客！标题看起来非常有趣，我很期待阅读您关于Shell编程中条件判断if命令的详细解析。您的持续创作真是令人鼓舞！鉴于您在Shell编程领域的造诣，我想建议您在未来的创作中可以探索一些高级的Shell编程技巧或者与其他编程语言的结合应用。谦虚的说，我相信这将使您的博客更加丰富多彩，并进一步提升读者的学习体验。期待您的下一篇作品！
Mapreduce
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)使用更多的站内链接；(3)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)。
通过使用ZooKeeper解决单点故障理论
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)使用标准目录；(3)使用更多的站内链接。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。