Spark相对于Hadoop有哪些优势?

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架, 是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;
但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。

相对于Hadoop,它主要有以下优势:
  • 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

  • 提供了高的性能和大数据处理能力,使得用户可以快速得到反馈体验更好。

  • 提供的数据集操作类型有很多种,不像Hadoop只提供了Map和Reduce两种操作。

  • 出色的支持Interactive Query、流计算、图计算等。

  • 在机器学习方面有着无与伦比的优势,特别适合需要多次迭代计算的算法。

  • 拥有非常出色的容错和调度机制,确保系统的稳定运行。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15498/viewspace-2123630/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/15498/viewspace-2123630/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值