伪分布式系列 - 第三篇 - spark-2.4.3环境搭建on hadoop3.2.0

最新推荐文章于 2024-08-09 09:30:00 发布

Bejpse

最新推荐文章于 2024-08-09 09:30:00 发布

阅读量263

点赞数

分类专栏： java 文章标签： java 后端

本文链接：https://blog.csdn.net/Bejpse/article/details/124487557

版权

392 篇文章 20 订阅

订阅专栏

基础环境搭建

spark-env.sh配置

cp spark-env.sh.template spark-env.sh

vim spark-env.sh 配置一下信息

export JAVA_HOME=/usr/local/java_1.8.0_121
#SCALA环境变量
export SCALA_HOME=/opt/bigdata/scala/default
#Hadoop路径
export HADOOP_HOME=/opt/bigdata/hadoop/default
#Hadoop配置目录
export HADOOP_CONF_DIR= $HADOOP_HOME/etc/hadoop export SPARK_YARN_USER_ENV=$ {HADOOP_CONF_DIR}
export SPARK_HOME=/opt/bigdata/spark/default
export HIVE_HOME=/opt/bigdata/hive/default
export HIVE_CONF_DIR= ${HIVE_HOME}/conf export PATH=$ {JAVA_HOME}/bin: ${SCALA_HOME}/bin:$ {HADOOP_HOME}/bin: ${SPARK_HOME}/bin:$ {HIVE_HOME}/bin:$PATH
spark-defaults.conf配置

cp spark-defaults.conf.template spark-defaults.conf
vim spark-defaults.conf 配置如下信息

spark job log收集,收集到hdfs上

spark.eventLog.enabled true
spark.eventLog.dir hdfs://ecs-6531-0002.novalocal:9000/tmp/spark/eventLogs
spark.eventLog.compress true
#默认序列化方式
spark.serializer org.apache.spark.serializer.KryoSerializer

部署模式yarn

spark.master yarn

默认driver核心数

spark.driver.cores 1

默认driver内存数

spark.driver.memory 800m

默认executer核心数

spark.executor.cores 1

默认executer内存数

spark.executor.memory 1000m

默认executer实例数

spark.executor.instances 1

hive仓库地址

spark.sql.warehouse.dir hdfs://ecs-6531-0002.novalocal:9000/user/root/warehouse
拷贝hive-site.xml到spark conf下,因为要连接hive

cp $HIVE_HOME/conf/hive-site.xml $SPARK_HOME/conf/hive-site.xml

vim /etc/profile

spark 配置

export SPARK_YARN_USER_ENV= ${HADOOP_CONF_DIR} export SPARK_HOME=/opt/bigdata/spark/default export PATH=$ {SCALA_HOME}/bin: ${SPARK_HOME}/bin:$ PATH

拷贝spark shuffle on yarn到包到yarn的目录下

cp /opt/bigdata/spark/spark-2.4.3-bin-hadoop2.7/yarn/spark-2.4.3-yarn-shuffle.jar /opt/bigdata/hadoop/hadoop-3.2.0/share/hadoop/yarn/

配置yarn-site.xml文件

需要把spark_shuffle加上

<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle,spark_shuffle</value>
</property>

关注