Spark相对于Hadoop有哪些优势?

最新推荐文章于 2024-01-28 14:30:53 发布

csd753111111

最新推荐文章于 2024-01-28 14:30:53 发布

阅读量1.5k

点赞数

文章标签：大数据

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境,Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；
但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。

相对于Hadoop,它主要有以下优势:

启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

提供了高的性能和大数据处理能力，使得用户可以快速得到反馈体验更好。

提供的数据集操作类型有很多种，不像Hadoop只提供了Map和Reduce两种操作。

出色的支持Interactive Query、流计算、图计算等。

在机器学习方面有着无与伦比的优势，特别适合需要多次迭代计算的算法。

拥有非常出色的容错和调度机制，确保系统的稳定运行。

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/15498/viewspace-2123630/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/15498/viewspace-2123630/

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

csd753111111

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark相对于Hadoop有哪些优势?

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算...
复制链接

扫一扫