对MapReduce初步认识

最新推荐文章于 2025-03-31 19:54:29 发布

kangwq2017

最新推荐文章于 2025-03-31 19:54:29 发布

阅读量775

点赞数

分类专栏： hadoop 文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aidway/article/details/51880959

版权

hadoop 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了MapReduce的基本原理，包括其“分而治之”的思想、map和reduce两个核心过程，以及良好的伸缩性和容错机制。同时也指出了MapReduce在处理计算密集型任务上的局限性，比如中间结果存储效率低等问题，这促使了更高效的分布式计算框架Spark的出现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MapReduce基于“分而治之”的思想，将计算任务抽象成map和reduce两个计算过程。通过适当的split任务，可以充分发挥单台机器的计算能力。同时，良好的伸缩性，使得集群容易扩展。在容错方面，单台节点的失败可由其它节点重算，不会影响其它节点的计算。其缺点是计算的中间结果以文件形式存储，效率较低。另外，MapReduce不适合计算密集型的操作，如机器学习，因为这类任务通常需要反复的迭代，而MapReduce的中间数据存储在磁盘上，速度较慢。因为有这样的问题，也就出现了Spark--基于MapReduce的新的分布式计算引擎。由此也可以感受到，新技术的发展往往是为了应对新的挑战，而对现有技术否定的结果-否定之否定的否定。

博客等级

码龄15年

82
原创

55
点赞

77
收藏

12
粉丝

关注

私信

热门文章

分类专栏

环境配置 1篇
经济学 1篇
python 1篇
poj 37篇
初心集 8篇
机器学习 3篇
Oracle 1篇
linux 8篇
windows 8篇
mysql 1篇
hadoop 9篇
java 2篇

展开全部收起

上一篇：: MapReduce：共同好友

下一篇：: 微评：【民政部：去年1224.7万对夫妻结婚384.1万对夫妻离婚】

最新评论

0-1背包：使用滚动数组时为何要逆序枚举
hello1979cn: 请问一下，滚动数组方案下，如果需要打印方案，能推导出来方案吗
0-1背包：使用滚动数组时为何要逆序枚举
雨宫奈原: 这样讲着就很清晰，终于明白了！
docker：不能访问宿主机
「才亿笔记」: 学长，你好，我问下，你这里说的启动docker时，是指启动docker服务？还是指启动docker中镜像的容器？
linux shell 自动输入y/yes
qq_27683941: scp 貌似不行 [code=plain] [alg@cdh601 python3]$ echo yes | scp train_cpu.py ${user_name}@${worker}:~/ The authenticity of host '192.168.2.202 (192.168.2.202)' can't be established. ECDSA key fingerprint is SHA256:+bs9ihoJmNCG5n1jwTKYHH49bc5dR9ww691oHHYJlp4. ECDSA key fingerprint is MD5:9c:1d:42:af:06:04:94:35:24:08:76:89:88:31:a1:43. Are you sure you want to continue connecting (yes/no)? [/code]
0-1背包：使用滚动数组时为何要逆序枚举
LAter.Charon: 正序的话可能导致一个东西被多次放入背包！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

kangwq2017 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。