1.安装好JDK:
JDK所有人肯定都装了,这里就不细说明了。
2.安装Hadoop并配置环境变量:
hadoop下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/
解压hadoop-2.8.3.tar.gz特定路径,如:D:\hadoop-2.8.3
添加系统变量HADOOP_HOME:D:\hadoop-2.8.3
在系统变量PATH中添加:D:\hadoop-2.8.3\bin
安装组件winutils:将winutils中对应的hadoop版本中的bin替换自己hadoop安装目录下的bin
3.Spark环境变量配置:
说明:spark是基于hadoop之上的,运行过程中会调用相关hadoop库,如果没配置相关hadoop运行环境,会提示相关出错信息,虽然也不影响运行。
下载对应hadoop版本的spark:https://www.apache.org/dyn/closer