参考博客
沉淀,再出发——在Hadoop集群的基础上搭建Spark - 精心出精品 - 博客园 (cnblogs.com)
博客上说明Hadoop伪分布也行
一、前提
1.java环境,jdk1.8及其以上,或者open角度看8及其以上,以便scala的安装
2.安装ssh(远程登陆服务器)这里我用xshell
3.Hadoop集群(这里在伪分布下实现)
4.安装scala根据博客安装的是2.11.8
https://downloads.lightbend.com/scala/2.11.8/scala-2.11.8.tgz
5.安装spark根据博客安装的是2.3.0