MapReduce的基本原理

最新推荐文章于 2024-08-09 22:26:50 发布

u013063153

最新推荐文章于 2024-08-09 22:26:50 发布

阅读量2.3k

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013063153/article/details/53116305

版权

MapReduce是一个用于大规模数据处理的软件框架，通过并行的Map和Reduce阶段在集群中处理大量数据。Map阶段将输入数据分割处理，Shuffle阶段进行排序，而Reduce阶段则汇总Map的输出。JobTracker管理TaskTracker资源，跟踪作业进度，提供容灾服务；TaskTracker执行任务并向JobTracker报告状态。然而，MapReduce存在可扩展性、可靠性和可用性问题，以及对其他编程模型支持不足的缺陷。

摘要由CSDN通过智能技术生成

MapReduce是一个软件框架，可方便的编写应用程序，以并行的方式在数千商用硬件组成的集群节点中处理数TB的数据，并且提供了可靠性和容错的能力。

MapReduce处理模型包括两个独立的步骤：

-并行Map阶段，输入数据被分割成离散块以便可以单独处理。

-shuffle阶段，每个Reduce的输入都是按照键排序的，系统执行排序的过程；

-Reduce阶段，汇总Map阶段的输出生成预期的结果。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。