1.Spark 介绍
【1】.spark处理大数据的统一分析计算引擎;
a.速度:在迭代循环的计算模型下,spark比Hadoop快100倍;
b.易用性:spark提供多种语言的API,如Java、Python、Scala、R、SQL等
c.扩展性:在spark RDD基础上,提供一整套的分析计算模型:spark SQL、spark Stresaming、spark MLLib和图计算;
d.运行: spark支持在hadoop、Hadoop, Apache Mesos, Kubernetes, standalone, or in the cloud.
2.spark安装部署:
ps:下载网址:http://spark.apache.org/downloads.html
(选择与您的Hadoop相对应的版本,我的是Hadoop2.7.3)
0).版本选型:spark2.1.2。依赖scala2.11.8
1).下载spark2.1.2.tar.gz
2).解压安装ÿ