跟天齐老师学Spark(1)--Spark简介

spark官网:http://spark.apache.org

Spark其实是一个大数据计算引擎,只能解决计算的问题,它需要依赖数据的存储系统;
Spark不会取代Hadoop,因为Hadoop不仅是解决了计算的问题,它还解决了存储的问题;
spark是apache旗下的一个开源框架。它的logo:快如闪电的一个集群。
用来做大规模的数据计算处理。
在2016年7月出来spark-2.0版本,我们现在使用的是1.6.2版本;

Spark比hadoop的MapReduce在内存中快100倍,即使在磁盘上也比Hadoop快10倍。
在Spark的计算引擎之上有很多强大的工具:spark sql,spark streaming,mllib,graphx。提供一站式计算服务(离线计算、实时计算、机器学习、图计算等)。这些都是它的子项目,但是他们都是运行在spark的计算引擎之上。
有了spark的话,我们只要一个spark集群即可。
如果用hadoop的话,要维护hadoop集群,可能还要维护storm集群。
但是如果你的公司搞了2年hadoop相关的技术了,现在突然转向spark的话,可能转化的成本比较高。
如果你的公司刚开始起步,可以优先选择spark技术。

它的特点:快,易用(java,scala,python,R),通用,运行在多平台(可以运行在yarn这个资源调度平台上,可以从hdfs中读数据,再写入hdfs,还可以运行在mesos资源调度平台上,spark还可以运行在自己独立的集群模式上,这就是standalone集群模式,spark还可以运行在云上,可以从hdfs中读数据,从hbase中读数据,从cassandra中读数据,还可以跑在S3上)

对spark贡献排名第一的是一个华人(美国伯克利大学)。还有很多的国人面孔。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

十光年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值