Spark集群环境配置

最新推荐文章于 2024-06-04 18:14:38 发布

Like English.

最新推荐文章于 2024-06-04 18:14:38 发布

阅读量790

点赞数 11

文章标签： spark ajax 大数据

本文链接：https://blog.csdn.net/2202_75677490/article/details/138255226

版权

修改配置文件

第一步:切换到conf配置文件夹下

第二步：重命名workers.template

第三步：编辑workers配置文件

1.编辑workers，

2.将原本的localhost更换为三台虚拟机名字后退出保存

第四步：

1.重命名spark-env.sh 并编辑（切换到conf路径下更改）

2.进入之后删除所用行，保存空白文件，插入以下内容

#设置JAVA安装目录

JAVA_HOME=/export/server/jdk1.8.0_65

#设置python安装目录

PYSPARK_PYTHON=/export/server/anaconda3/bin/python

#读取hadoop软件配置目录

HADOOP_CONF_DIR=/export/server/hadoop-3.3.0/etc/hadoop

#指定spark中的master的ip

SPARK_MASTER_HOST=shuju201

#代码访问master的端口

SPARK_MASTER_WEBUI_POST=7077

#浏览器访问master的端口

SPARK_MASTER_WEBUI_POST=8080

#worker的配置

SPARK_WORKER_CORES=1

SPARK_WORKER_MEMORY=1g

#代码访问worker的端口

SPARK_WORKER_WEBUI_POST=7078

#浏览器访问worker的端口

SPARK_WORKER_WEBUI_POST=8081

JAVA安装目录以及python安装目录、Hadoop软件配置目录位置如何查找

JAVA的安装目录在vim /etc/profile下

Hadoop软件配置目录如图

找到计算机的如下路径，之后查看当前路径

第五步：将配置好的所有内容传送给其他虚拟机

scp -r /export/server/spark shuju202:/export/server

scp -r /etc/bashrc shuju202:/etc

scp -r /etc/profile shuju202:/etc

第六步：决对路径启动spark集群

/export/server/spark/sbin/start-all.sh

pyspark --master spark://shuju201:7077

第七步：重命名Hadoop和spark的启动脚本命令

2.重命名spark启动和停止命令

3.使用命令查看能否成功

所用到的全部指令

cd /export/server/spark/conf
mv workers.template  wokers
vim wokers
mv spark-env.sh.template spark-env.sh
vim spark-env.sh
vim etc/profile
pwd
vim spark-env.sh
scp -r /export/server/spark shuju202:/export/server
scp -r /export/server/spark shuju203:/export/server
scp -r /etc/profile shuju202:/etc
scp -r /etc/profile shuju203:/etc
scp -r /etc/bashrc shuju203:/etc
scp -r /etc/bashrc shuju202:/etc
/export/server/spark/sbin/start-all.sh
pyspark --master spark://shujuu201:7077
cd /export/server/spark/sbin
mv start-all.sh start-all-spark.sh
mv stop-all.sh stop-all-spark.sh
start-all-spark.sh
stop-all-spark.sh