学习笔记Spark(一)—— Spark入门

一、Spark简介

什么是Spark?

  • 快速、分布式、可扩展、容错的集群计算框架;
  • Spark是基于内存计算的大数据分布式计算框架;
  • 低延迟的复杂分析;
  • Spark是Hadoop MapReduce的替代方案。

二、Spark的发展历史

对于一个具有相当技术门槛与复杂度的平台,Spark从诞生到正式版本的成熟,经历的时间如此之短,让人感到惊诧。目前,Spark已经成为Apache软件基金会旗下的顶级开源项目。下面是Spark的发展历程简述:

  • 2009年,Spark诞生于伯克利大学AMPLab,最初属于伯克利大学的研究性项目,实验室的研究人员之前基于Hadoop MapReduce工作,他们发现MapReduce对于迭代和交互式计算任务效率不高,因此他们研究的Spark主要为交互式查询和迭代算法设计,支持内存存储和高效的容错恢复。
  • 2010年Spark正式开源。
  • 2013年6月成为了Apache基金会的孵化器项目。
  • 2014年2月,仅仅经历8个月的时间Spark就成为Apache基金会的顶级项目,同时,大数据公司Cloudera宣称加大Spark框架的投入来取代MapReduce。
  • 2014年5月,Pivotal Hadoop集成Spark全栈,同月30日,Spark1.0.0发布。
  • 2015年Spark增加了新的DataFrames API和Dataset API
  • 2016年Spark2.0发布,Spark2.0与1.0的区别主要是2.0修订了API的兼容性问题。
  • 2017年在美国旧金山
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

别呀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值