为什么Spark比MapReduce快？

最新推荐文章于 2024-02-20 16:03:48 发布

m是只奶牛猫

最新推荐文章于 2024-02-20 16:03:48 发布

阅读量315

点赞数

分类专栏：大数据相关文章标签： spark mapreduce hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jason1511/article/details/130210508

版权

大数据相关专栏收录该内容

7 篇文章 1 订阅

订阅专栏

为什么Spark比MapReduce快？

小记。

MapReduce是基于磁盘的计算引擎，这里的"基于磁盘"指的是，mr多个作业之间的数据通信，是基于磁盘IO的，Map阶段产生的数据必须要全部的写入磁盘中，且这些数据会进行sort和combine操作，再进入reduce阶段，IO效率十分低。
Spark是基于内存的DAG计算模型，能够对计算过程进行优化，减少shuffle和数据落盘的次数，在每个阶段中都会尽可能的使用内存，大大提高计算的效率，并且数据通信也是基于内存的。
MR是多进程运行，虽然易控制资源且一个进程失败不影响其他进程，但是进程的启动和销毁会占用大量的时间，从而影响效率。这也是我们使用MR执行简单任务时也会耗费很长时间的主要原因。
Spark是多线程运行，首先线程的启停比进程快很多。粗粒度的资源申请，效率高，但是也有一个缺点：若同一节点execute中有多个task时，会容易出现资源被征用的情况。因为spark中资源分配的最细粒度是execute，无法对更细的task进行资源控制。所以在处理巨大数量级的任务时，在资源有限的情况下，运行会不稳定。
MR只要有reduce，就必然要进行排序和shuffle。mr的map端shuffle对map的输出结果写入缓存、分区、排序、合并后再写入磁盘。reduce端的shuffle是对不同map机器上取回输出的数据，进行归并后再交由reduce处理。
Spark提供了多种shuffle方案的选择，高效利用内存，同时有可能减少或避免shuffle操作。
spark有更加灵活的内存管理机制：堆内内存和堆外内存和动态内存管理机制。

注意：并不是所有情况下Spark都比MapReduce要快，Spark对机器性能的要求相对较高，RDD的并行计算又一排瘀多核CPU的支持。

所以在机器性能有限，或者数据量巨大的情况下，可以选择更加稳定的MapReduce。

m是只奶牛猫

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
为什么Spark比MapReduce快？

Spark比MapReduce要快的原因是什么？spark一定比mapreduce要快吗？
复制链接

扫一扫

专栏目录

m是只奶牛猫 CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

130万+: 周排名

22万+: 总排名

2万+: 访问

: 等级

221: 积分

14: 粉丝

25: 获赞

29: 评论

54: 收藏

私信

关注

热门文章

分类专栏

最新评论

Ambari-2.7.5在麒麟V10操作系统中的集群部署（二）
陈皮变猪皮: 关于No module named yum，我这边ctyunos是修改了/usr/lib/ambari-agent/lib/resource_management/core/providers/package/yumrpm.py文件里关于yum_check_package_available的方法，重写了判断有无包的方法
Ambari-2.7.5在麒麟V10操作系统中的集群部署（一）
W2789545403: 你好我想一下你用的版本是sp1得还是sp2得
瑞吉外卖项目中手机短信验证登录的问题及过程处理
学费了吗学费了: 问一下为什么控制台显示发送成功了，但是手机却没有验证码
瑞吉外卖项目中手机短信验证登录的问题及过程处理
m是只奶牛猫: 这个属于前端问题，你看看你的前端代码vue中绑定的v-on模块那个数据没有定义
瑞吉外卖项目中手机短信验证登录的问题及过程处理
程序员小林同学: 佬，为啥改了获取验证码按钮一样没有给请求，然后F12在console里报错[Vue warn]: Error in v-on handler: "ReferenceError: data is not defined"

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

m是只奶牛猫 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。