spark配置

刘二光

已于 2022-01-24 09:31:29 修改

阅读量989

点赞数

分类专栏：云知识 centos 文章标签： spark hadoop big data

于 2022-01-23 10:48:32 首次发布

本文链接：https://blog.csdn.net/weixin_43621549/article/details/122648379

版权

centos 同时被 2 个专栏收录

28 篇文章 1 订阅

订阅专栏

云知识

24 篇文章 0 订阅

订阅专栏

1.上传spark-2.4.0-bin-hadoop2.6.tgz到/opt目录，并解压到/usr/local
tar -zxf /opt/spark-2.4.0-bin-hadoop2.6.tgz -C /usr/local/

2.进入/usr/local/spark-2.4.0-bin-hadoop2.6/conf
复制slaves.template：cp slaves.template slaves
修改slaves，先删除其中的localhost，然后添加：
slave1
slave2
slave3

3.修改spark-defaults.conf
cp spark-defaults.conf.template spark-defaults.conf
vi spark-defaults.conf
添加：
spark.master spark://master:7077
spark.eventLog.enabled true
spark.eventLog.dir hdfs://master:8020/spark-logs
spark.history.fs.logDirectory hdfs://master:8020/spark-logs

4.修改spark-env.sh
cp spark-env.sh.template spark-env.sh
vi spark-env.sh
添加：
JAVA_HOME=/usr/java/jdk1.8.0_151
HADOOP_CONF_DIR=/usr/local/hadoop-2.6.5/etc/hadoop
SPARK_MASTER_IP=master
SPARK_MASTER_PORT=7077
SPARK_WORKER_MEMORY=512m
SPARK_WORKER_CORES=1
SPARK_EXECUTOR_MEMORY=512m
SPARK_EXECUTOR_CORES=1
SPARK_WORKER_INSTANCES=1

5.启动Hadoop集群，在HDFS中新建目录：
hdfs dfs -mkdir /spark-logs

6.将Spark安装包分发到其他节点
scp -r /usr/local/spark-2.4.0-bin-hadoop2.6/ slave1:/usr/local/
scp -r /usr/local/spark-2.4.0-bin-hadoop2.6/ slave2:/usr/local/
scp -r /usr/local/spark-2.4.0-bin-hadoop2.6/ slave3:/usr/local/

7.在所有节点配置Spark环境变量
vi /etc/profile
在文件尾加入：
export SPARK_HOME=/usr/local/spark-2.4.0-bin-hadoop2.6
export PATH= $P A T H :$ SPARK_HOME/bin

执行source /etc/profile使命令生效

8.启动spark
进入/usr/local/spark-2.4.0-bin-hadoop2.6/sbin
执行
./start-all.sh
9.查看客户端
http://master:8080

刘二光

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark配置

1.上传spark-2.4.0-bin-hadoop2.6.tgz到/opt目录，并解压到/usr/localtar -zxf /opt/spark-2.4.0-bin-hadoop2.6.tgz -C /usr/local/2.进入/usr/local/spark-2.4.0-bin-hadoop2.6/conf复制slaves.template：cp slaves.template slaves修改slaves，先删除其中的localhost，然后添加：slave1slave2slave3
复制链接

扫一扫