实验目录
目录
实验环境
- Windows10+Centos7+jdk1.8.0_171+spark-2.4.8
准备工作
- jdk-8u171-linux-x64.tar.gz和spark-2.4.8-bin-hadoop2.7.tgz
安装步骤
- 将spark-2.4.8-bin-hadoop2.7.tgz上传至/tools/目录下
- 进入/tools/目录下将其解压至/training/目录下,执行:
tar -zxvf spark-2.4.8-bin-hadoop2.7.tgz -C /training/
- 无需配置环境变量,因为spark和hadoop的脚本命令有冲突
- 进入/training/spark-2.4.8-bin-hadoop2.7目录下,创建history与logs文件
mkdir history mkdir logs
- 进入/training/spark-2.4.8-bin-hadoop2.7/conf目录下,修改配置文件:spark-env.sh(由于事先不存在,需要先复制)
// 复制命令 cp spark-env.sh.template spark-env.sh // 添加内容 export JAVA_HOME=/training/jdk1.8.0_171 export SPARK_MASTER_HOST=hadoop