安装spark on yarn - CentOS6大数据套件HA安装(4)

 

环境变量参考【CentOS6-大数据套件HA安装(1)统一环境配置)

此处所有机器防火墙关闭,实际可根据需要调整。软件包统一在/usr/local/soft 目录,安装目录为:/hadoop

安装 spark

  1. 解压
tar -xzvf /usr/local/soft/spark-2.2.1-bin-hadoop2.7.tgz -C /hadoo
  1. 配置 spark-env.sh
cp spark-2.2.1-bin-hadoop2.7/conf/spark-env.sh.template spark-2.2.1-bin-hadoop2.7/conf/spark-env.sh
vi spark-2.2.1-bin-hadoop2.7/conf/spark-env.sh
export JAVA_HOME=/usr/java/jdk1.8.0_172-amd64
export SCALA_HOME=/usr/scala/scala-2.12.5

export HADOOP_HOME=/hadoop/hadoop-2.7.6
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export SPARK_HOME=/hadoop/spark-2.2.1-bin-hadoop2.7
  1. 配置 spark在hdfs上的jar目录
# 在hdfs上创建目录
hdfs dfs -mkdir -p /user/spark/jars
# 将spark的jar上传到hdfs
hdfs dfs -put /hadoop/spark-2.2.1-bin-hadoop2.7/jars/* /user/spark/jars/

# 配置指向hdfs的目录
cp spark-2.2.1-bin-hadoop2.7/conf/spark-defaults.conf.template spark-2.2.1-bin-hadoop2.7/conf/spark-defaults.conf
vi spark-2.2.1-bin-hadoop2.7/conf/spark-defaults.conf

spark.yarn.jars hdfs://ns1/user/spark/jars/*
  1. 分发其他节点
scp -r spark-2.2.1-bin-hadoop2.7 hadoop@hadoop101:/hadoop/
scp -r spark-2.2.1-bin-hadoop2.7 hadoop@hadoop102:/hadoop/
scp -r spark-2.2.1-bin-hadoop2.7 hadoop@hadoop103:/hadoop/
scp -r spark-2.2.1-bin-hadoop2.7 hadoop@manager203:/hadoop/
  1. 测试
./spark-2.2.1-bin-hadoop2.7/bin/spark-submit --master yarn --deploy-mode cluster --class org.apache.spark.examples.SparkPi  --executor-memory 512M --num-executors 1  /hadoop/spark-2.2.1-bin-hadoop2.7/examples/jars/spark-examples_2.11-2.2.1.jar 10

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值