1.Spark运行环境:
Spark是Scala语言写的,运行在JVM上,所以运行环境是Java7+。
如果使用Python API,需要安装Python 2.6+或者Python 3.4+。
Spark 和Scala对应的版本如下:
Spark 1.6.2 – Scala 2.10 Spark 2.0.0 – Scala 2.11
2.Spark下载:
下载地址官网:http://spark.apache.org/downloads.html
搭Spark不需要Hadoop,如有Hadoop集群,可选择相对应的版本
下载方式:
1.可直接下载早本地后put到虚拟机中
2.复制链接到虚拟机里面下载通过以下代码进行下载,速度可能会比较慢。
wget https://d3kbcqa49mib13