学习笔记Spark（一）—— Spark入门

最新推荐文章于 2022-12-30 10:22:38 发布

别呀

最新推荐文章于 2022-12-30 10:22:38 发布

阅读量644

点赞数 1

文章标签： spark scala big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46485161/article/details/120631647

版权

一、Spark简介

什么是Spark？

快速、分布式、可扩展、容错的集群计算框架；
Spark是基于内存计算的大数据分布式计算框架；
低延迟的复杂分析；
Spark是Hadoop MapReduce的替代方案。

二、Spark的发展历史

对于一个具有相当技术门槛与复杂度的平台，Spark从诞生到正式版本的成熟，经历的时间如此之短，让人感到惊诧。目前，Spark已经成为Apache软件基金会旗下的顶级开源项目。下面是Spark的发展历程简述：

2009年，Spark诞生于伯克利大学AMPLab，最初属于伯克利大学的研究性项目，实验室的研究人员之前基于Hadoop MapReduce工作，他们发现MapReduce对于迭代和交互式计算任务效率不高，因此他们研究的Spark主要为交互式查询和迭代算法设计，支持内存存储和高效的容错恢复。
2010年Spark正式开源。
2013年6月成为了Apache基金会的孵化器项目。
2014年2月，仅仅经历8个月的时间Spark就成为Apache基金会的顶级项目，同时，大数据公司Cloudera宣称加大Spark框架的投入来取代MapReduce。
2014年5月，Pivotal Hadoop集成Spark全栈，同月30日，Spark1.0.0发布。
2015年Spark增加了新的DataFrames API和Dataset API
2016年Spark2.0发布，Spark2.0与1.0的区别主要是2.0修订了API的兼容性问题。
2017年在美国旧金山

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

别呀 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。