干货丨Spark与Hadoop有哪些区别？

最新推荐文章于 2024-06-24 00:33:54 发布

传智播客

最新推荐文章于 2024-06-24 00:33:54 发布

阅读量5.7k

点赞数 2

文章标签： spark hadoop 大数据 hive mapreduce

Hadoop与Spark都是大数据计算框架，但是两者各有自己的优势，Spark与Hadoop的区别主要有以下几点。

1、编程方式
Hadoop的MapReduce在计算数据时，计算过程必须要转化为Map和Reduce两个过程，从而难以描述复杂的数据处理过程；而Spark的计算模型不局限于Map和Reduce操作，还提供了多种数据集的操作类型，编程模型比MapReduce更加灵活。

2、数据存储

Hadoop的 MapReduce进行计算时，每次产生的中间结果都是存储在本地磁盘中；而Spark在计算时产生的中间结果存储在内存中。

3、数据处理

Hadoop在每次执行数据处理时，都需要从磁盘中加载数据，导致磁盘的I/O开销较大；而Spark在执行数据处理时，只需要将数据加载到内存中，之后直接在内存中加载中间结果数据集即可，减少了磁盘的1O开销。

4、数据容错
MapReduce计算的中间结果数据保存在磁盘中，并且 Hadoop框架底层实现了备份机制，从而保证了数据容错；同样 Spark RDD实现了基于 Lineage的容错机制和设置检查点的容错机制，弥补了数据在内存处理时断电丢失的问题。

在Spark与Hadoop的性能对比中，较为明显的缺陷是Hadoop中的MapReduce计算延迟较高，无法胜任当下爆发式的数据增长所要求的实时、快速计算的需求。

从上图可以看出，使用Hadoop MapReduce进行计算时，每次计算产生的中间结果都需要从磁盘中读取并写入，大大增加了磁盘的I/O开销。

而使用Spark进行计算时，需要先将磁盘中的数据读取到内存中，产生的数据不再写入磁盘，直接在内存中迭代处理，这样就避免了从磁盘中频繁读取数据造成的不必要开销。通过官方计算测试，Hadoop与Spark执行逻辑回归所需的时间对比，如图所示。

从上图可以看出，Hadoop与Spark执行的所需时间相差超过100倍。

点赞 · 分享 · 转发

帮助更多需要的人看到

END

关注

2
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
干货丨Spark与Hadoop有哪些区别？

Hadoop与Spark都是大数据计算框架，但是两者各有自己的优势，Spark与Hadoop的区别主要有以下几点。1、编程方式Hadoop的MapReduce在计算数据时，计算过程必须要转...
复制链接

扫一扫

传智播客 CSDN认证博客专家 CSDN认证企业博客

码龄13年

156: 原创

-: 周排名

58万+: 总排名

79万+: 访问

: 等级

7889: 积分

257: 粉丝

163: 获赞

69: 评论

975: 收藏

私信

关注

热门文章

最新评论

黑马Java新教程上线！完全开源，随意商用！
追向青春: 我想问一下为什么小破站上面的对应视频没有设备管理以及后面的视频
7年无人敢动的「屎山」代码：if循环19.8亿次
fuwu1245: 新闻源在哪啊？
Spring Cloud Alibaba实战：微服务架构精讲
天蓝999: 可以的，我看的另一个SpringCloud项目视频，从零开发，五天学会了SpringCloud项目实战：https://knife.blog.csdn.net/article/details/134659054
程序员干个五六年能存100万，焦虑啥？
只图安逸生活: 五六年100万你怕是做梦，培训机构的一贯的套路就是利用高薪骗你交学费
那些从黑马毕业的学生，都去哪工作了？
m0_53784368: 网上都是在制造焦虑，实际上根本没那么严重，我中专毕业，一年经验，成都面了8家，拿了7k个office，最高320k，最低270k，320k是外包，还有个300k的自研可以考虑一下，不说了，明天还要两个面试，寒冬年年有，年年都是计算机，结果计算机工资不是还是轻轻松松月入过w， xdm，有一说一，现在不学JAVA，以后就没机会了，趁着现在的红利，狠狠的赚一笔

大家在看

Linux：开发工具（1） 1589

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。