Spark On Yarn 详细配置流程

最新推荐文章于 2024-04-16 07:28:44 发布

李天泉

最新推荐文章于 2024-04-16 07:28:44 发布

阅读量421

点赞数

Spark 同时被 3 个专栏收录

9 篇文章 0 订阅

订阅专栏

Hadoop

7 篇文章 1 订阅

订阅专栏

YARN

1 篇文章 0 订阅

订阅专栏

1、系统与软件准备

系统：centos7
软件：

hadoop-2.7.2.tar.gz，请勿选择src版本，否则需要自行编译
jdk-7u79-linux-x64.tar.gz
scala-2.10.3.tgz
spark-1.6.1-bin-hadoop2.6.tgz，选择hadooppre-built版本，否则需要安装后编译
zookeeper-3.3.6.tar.gz

2、详细配置流程说明

1，JDK配置

# tar xvzf jdk-7u45-linux-x64.tar.gz -C/usr/local

# cd /usr/local

# ln -s jdk1.7.0_45 jdk

# vim /etc/profile 加入以下内容

[html] view plain copy

export JAVA_HOME=/usr/local/jdk
export CLASS_PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$PATH:$JAVA_HOME/bin

# source /etc/profile

2. Scala安装

# tar xvzf scala-2.10.3.tgz -C/usr/local

# cd /usr/local

# ln -s scala-2.10.3 scala

# vim /etc/profile 加入以下内容

[html] view plain copy

export SCALA_HOME=/usr/local/scala
export PATH=$PATH:$SCALA_HOME/bin

3. SSH免登录配置

#ssh-keygen

在node1下生成的密钥对：id_rsa和id_rsa.pub，默认存储在"~/.ssh"目录下，包括两个文件，id_rsa和id_rsa.pub，分别为私钥和公钥

将公钥写入信任文件中

#cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

然后修改authorized_keys文件的权限

#chmod 644 ~/.ssh/authorized_keys

node1中的authorized_keys拷贝至其余节点的~/.ssh目录下，修改SSH配置文件"/etc/ssh/sshd_config"的下列内容（这步可以省略）

RSAAuthentication yes # 启用 RSA 认证

PubkeyAuthentication yes # 启用公钥私钥配对认证方式

AuthorizedKeysFile .ssh/authorized_keys # 公钥文件路径（和上面生成的文件同）

#service sshd restart

重启SSH服务

4.主机名设置

# vim /etc/hosts

[html] view plain copy

10.25.248.1    node1
10.25.248.29   node2
10.25.248.17   node3

#vi /etc/sysconfig/network

HOSTNAME=node1/node2/node3

5. Zookeeper安装

# mkdir –p /root/data/hadoop/zookeeper/{data,logs}

两个文件夹都需要预先建立好，否则会运行时会报错

# vim /usr/local/zookeeper/conf/zoo.cfg

[html] view plain copy

tickTime=2000
initLimit=10
syncLimit=5

dataDir=/root/data/hadoop/zookeeper/data
clientPort=2181

server.1=10.25.248.1:2888:3888
server.2=10.25.248.29:2888:3888
server.3=10.25.248.17:2888:3888

接着在/root/data/hadoop/zookeeper/data下分别建立名为myid文件，文件内容为上述zoo.cfg中IP地址对应server.[number]中的number

node1 : echo 1 > /root/data/hadoop/zookeeper/data/myid

node2 : echo 2 > /root/data/hadoop/zookeeper/data/myid

node3 : echo 3 > /root/data/hadoop/zookeeper/data/myid

执行zkServer.sh start启动zookeeper，相应zkServer.shstop退出，zkServer.sh status查看状态

分别在node1，node2，node3执行zkServer.sh start，然后通过zkServer.sh status查看状态，如果发现每个node当前状态标记为follower或者leader，那么测试通过

6. Hadoop（HDFS HA）集群部署

# tar xvzf hadoop-2.2.0.tgz -C/usr/local

# cd /usr/local

# ln -s hadoop-2.2.0 hadoop

#vim /etc/profile

[html] view plain copy

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_PID_DIR=/root/data/hadoop/pids
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="$HADOOP_OPTS-Djava.library.path=$HADOOP_HOME/lib/native"
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HDFS_CONF_DIR=$HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

接下来有8个配置文件需要修改，配置文件均在$HADOOP_HOME/etc/hadoop/目录下

hadoop-env.sh, mapred-env.sh, yarn-env.sh中加入以下内容

[html] view plain copy

export JAVA_HOME=/usr/local/jdk
export CLASS_PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_PID_DIR=/root/data/hadoop/pids
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="$HADOOP_OPTS-Djava.library.path=$HADOOP_HOME/lib/native"

export HADOOP_PREFIX=$HADOOP_HOME

export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HDFS_CONF_DIR=$HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

2，core-site.xml

[html] view plain copy

<configuration>
 <property>
 <name>fs.defaultFS</name>
 <value>hdfs://lab369</value> 
 </property>

 <property>
 <name>io.file.buffer.size</name>
 <value>131072</value>
 </property>

 <property>
 <name>hadoop.tmp.dir</name>
 <value>file:/root/data/hadoop/storage/tmp</value>
 </property>

 <property>
 <name>ha.zookeeper.quorum</name>
 <value>node1:2181,node2:2181,node3:2181</value>
 </property>

 <property>
 <name>ha.zookeeper.session-timeout.ms</name>
 <value>2000</value>
 </property>

 <property>
 <name>fs.trash.interval</name>
 <value>4320</value>
 </property>

 <property>
 <name>hadoop.http.staticuser.use</name>
 <value>root</value>
 </property>

 <property>
 <name>hadoop.proxyuser.hadoop.hosts</name>
 <value>*</value>
 </property>

 <property>
 <name>hadoop.proxyuser.hadoop.groups</name>
 <value>*</value>
 </property>

 <property>
 <name>hadoop.native.lib</name>
 <value>true</value>
 </property>
</configuration>

3， hdfs-site.xml

[html] view plain copy

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>




<configuration>
 <property>
 <name>dfs.namenode.name.dir</name>
 <value>file:/root/data/hadoop/storage/hdfs/name</value>
 </property>

 <property>
 <name>dfs.datanode.data.dir</name>
 <value>file:/root/data/hadoop/storage/hdfs/data</value>
 </property>

 <property>
 <name>dfs.replication</name>
 <value>2</value>
 </property>

 <property>
 <name>dfs.blocksize</name>
 <value>67108864</value>
 </property>

 <property>
 <name>dfs.datanode.du.reserved</name>
 <value>10737418240</value>
 </property>

 <property>
 <name>dfs.webhdfs.enabled</name>
 <value>true</value>
 </property>

 <property>
 <name>dfs.permissions</name>
 <value>true</value>
 </property>

 <property>
 <name>dfs.permissions.enabled</name>
 <value>true</value>
 </property>

 <property>
 <name>dfs.nameservices</name>
 <value>lab369</value>
 </property>

 <property>
 <name>dfs.ha.namenodes.lab369</name>
 <value>nn1,nn2</value>
 </property>

 <property>
 <name>dfs.namenode.rpc-address.lab369.nn1</name>
 <value>node1:8020</value>
 </property>

 <property>
 <name>dfs.namenode.rpc-address.lab369.nn2</name>
 <value>node2:8020</value>
 </property>

 <property>
 <name>dfs.namenode.servicerpc-address.lab369.nn1</name>
 <value>node1:53310</value>
 </property>

 <property>
 <name>dfs.namenode.servicerpc-address.lab369.nn2</name>
 <value>node2:53310</value>
 </property>

 <property>
 <name>dfs.namenode.http-address.lab369.nn1</name>
 <value>node1:50070</value> 
 </property>

 <property>
 <name>dfs.namenode.http-address.lab369.nn2</name>
 <value>node2:50070</value>
 </property>

 <property>
 <name>dfs.datanode.http.address</name>
 <value>0.0.0.0:50070</value>
 </property>

 <property>
 <name>dfs.namenode.shared.edits.dir</name>
 <value>qjournal://node1:8485;node2:8485;node3:8485/lab369</value>
 </property>

 <property>
 <name>dfs.client.failover.proxy.provider.lab369</name>
 <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
 </property>

 <property>
 <name>dfs.ha.fencing.methods</name>
 <value>sshfence</value>
 </property>

 <property>
 <name>dfs.ha.fencing.ssh.private-key-files</name>
 <value>/root/.ssh/id_rsa</value>
 </property>

 <property>
 <name>dfs.ha.fencing.ssh.connect-timeout</name>
 <value>30000</value>
 </property>

 <property>
 <name>dfs.journalnode.edits.dir</name>
 <value>/root/data/hadoop/storage/hdfs/journal</value>
 </property>

 <property>
 <name>dfs.ha.automatic-failover.enabled</name>
 <value>true</value>
 </property>

 <property>
 <name>ha.failover-controller.cli-check.rpc-timeout.ms</name>
 <value>60000</value>
 </property>

 <property>
 <name>ipc.client.connect.timeout</name>
 <value>60000</value>
 </property>

 <property>
 <name>dfs.image.transfer.bandwidthPerSec</name>
 <value>41943040</value>
 </property>

 <property>
 <name>dfs.namenode.accesstime.precision</name>
 <value>3600000</value>
 </property>

 <property>
 <name>dfs.datanode.max.transfer.threads</name>
 <value>4096</value>
 </property>
</configuration>

4，mapred-site.xml

[html] view plain copy

<configuration>
 <property>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
 </property>

 <property>
 <name>mapreduce.jobhistory.address</name>
 <value>node1:10020</value>
 </property>

 <property>
 <name>mapreduce.jobhistory.webapp.address</name>
 <value>node1:19888</value>
 </property>

 <property>
 <name>mapreduce.application.classpath</name>
 <value>
 /usr/local/hadoop/etc/hadoop,
 /usr/local/hadoop/share/hadoop/common/*,
 /usr/local/hadoop/share/hadoop/common/lib/*,
 /usr/local/hadoop/share/hadoop/hdfs/*,
 /usr/local/hadoop/share/hadoop/hdfs/lib/*,
 /usr/local/hadoop/share/hadoop/mapreduce/*,
 /usr/local/hadoop/share/hadoop/mapreduce/lib/*,
 /usr/local/hadoop/share/hadoop/yarn/*,
 /usr/local/hadoop/share/hadoop/yarn/lib/*
 </value>
 </property>
</configuration>

5，yarn-site.xml

[html] view plain copy

<configuration>


 <property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>

 <property>
 <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
 <value>org.apache.hadoop.mapred.ShuffleHandler</value>
 </property>

 <property>
 <name>yarn.resourcemanager.scheduler.address</name>
 <value>node1:8030</value>
 </property>

 <property>
 <name>yarn.resourcemanager.resource-tracker.address</name>
 <value>node1:8031</value>
 </property>

 <property>
 <name>yarn.resourcemanager.address</name>
 <value>node1:8032</value>
 </property>

 <property>
 <name>yarn.resourcemanager.admin.address</name>
 <value>node1:8033</value>
 </property>

 <property>
 <name>yarn.resourcemanager.webapp.address</name>
 <value>node1:80</value>
 </property>

 <property>
 <name>yarn.nodemanager.hostname</name>
 <value>node3</value> 
 <description>the nodemanagers bind to this port</description>
 </property>

 <property>
 <name>yarn.nodemanager.webapp.address</name>
 <value>${yarn.nodemanager.hostname}:80</value>
 </property>

 <property>
 <name>yarn.nodemanager.address</name>
 <value>${yarn.nodemanager.hostname}:8034</value>
 <description>the nodemanagers bind to this port</description>
 </property>

 <property>
 <name>yarn.nodemanager.local-dirs</name>
 <value>${hadoop.tmp.dir}/nodemanager/local</value>
 </property>

 <property>
 <name>yarn.nodemanager.remote-app-log-dir</name>
 <value>${hadoop.tmp.dir}/nodemanager/remote</value>
 </property>

 <property>
 <name>yarn.nodemanager.log-dirs</name>
 <value>${hadoop.tmp.dir}/nodemanager/logs</value>
 </property>

 <property>
 <name>yarn.nodemanager.log.retain-seconds</name>
 <value>604800</value>
 </property>

 <property>
 <name>yarn.nodemanager.resource.cpu-vcores</name>
 <value>2</value>
 </property>

 <property>
 <name>yarn.nodemanager.resource.memory-mb</name>
 <value>10240</value>
 </property>

 <property>
 <name>yarn.scheduler.minimum-allocation-mb</name>
 <value>256</value>
 </property>

 <property>
 <name>yarn.scheduler.maximum-allocation-mb</name>
 <value>40960</value>
 </property>

 <property>
 <name>yarn.scheduler.minimum-allocation-vcores</name>
 <value>1</value>
 </property>

 <property>
 <name>yarn.scheduler.maximum-allocation-vcores</name>
 <value>8</value>
 </property>
</configuration>

6，slaves（此处如果超过一个节点，不要填主机名，要填IP）

[html] view plain copy

10.25.248.17

接下来依次执行以下命令：

a) 在namenode1上执行，创建命名空间

# hdfs zkfc -formatZK

b) 在对应的节点上启动日志程序journalnode

# cd /usr/local/hadoop && ./sbin/hadoop-daemon.sh start journalnode

c) 格式化主NameNode节点（node1）

# hdfs namenode -format

d) 启动主NameNode节点

# cd /usr/local/hadoop && sbin/hadoop-daemon.sh start namenode

e) 格式备NameNode节点（node2）

# hdfs namenode -bootstrapStandby

f) 启动备NameNode节点（node2）

# cd /usr/local/hadoop && sbin/hadoop-daemon.sh start namenode

g) 在两个NameNode节点（node1、node2）上执行

# cd /usr/local/hadoop && sbin/hadoop-daemon.sh start zkfc

h) 启动所有的DataNode节点（node3）

# cd /usr/local/hadoop && sbin/hadoop-daemon.sh start datanode

i) 启动Yarn（node1）

# cd /usr/local/hadoop &&sbin/start-yarn.sh

7，Spark安装与配置

# tar xvzf spark-0.9.0-incubating.tgz-C/usr/local

# cd /usr/local

# ln -s spark-0.9.0-incubating spark

# vim /etc/profile

export SPARK_HOME=/usr/local/spark

export PATH=$PATH:$SPARK_HOME/bin

# source /etc/profile

# cd /usr/local/spark/conf

# mkdir -p /data/spark/tmp
接下来，配置两个配置文件，文件在SPARK_HOME/conf/目录下

1，spark-env.sh

[html] view plain copy

export JAVA_HOME=/usr/local/jdk
export SCALA_HOME=/usr/local/scala
export HADOOP_HOME=/usr/local/hadoop
export SPARK_MASTER_PORT=7077
export SPARK_MASTER_WEBUI_PORT=7070
export SPARK_WORKER_CORES=2
export SPARK_WORKER_MEMORY=1024m
export SPARK_WORKER_INSTANCES=2

export SPARK_LOCAL_DIR="/root/data/spark/tmp"
export SPARK_JAVA_OPTS="-Dspark.storage.blockManagerHeartBeatMs=60000-Dspark.local.dir=$SPARK_LOCAL_DIR -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:$SPARK_HOME/logs/gc.log -XX:+UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:CMSInitiatingOccupancyFraction=60"

2，slaves（多个节点不能是主机名）

[html] view plain copy

10.25.248.29
10.25.248.17

分别进入每个节点的/usr/local/spark/sbin目录下，主节点执行#./start-master.sh，子节点执行#./start-slaves.sh，或者在主节点直接执行sbin/start-all.sh

8，测试流程

1，进程运行情况测试

在每个节点执行#jps指令，若输出结果为以下内容，则测试通过，否则进入/usr/local/hadoop/logs或者/usr/local/spark/logs目录下查看log文件进行检查

主namenode

从namenode

datanode节点

其中Master和Worker是Spark相应进程
Hmaster和HregionServer为Hbase相应进程(这里不需要)
DFSZKFailoverController为Zookeeper相应进程
ResourceManager和NodeManager为Yarn相应进程

其余为Hadoop相应进程

2，HDFS测试

在任意节点下执行

#hadoopfs –mkdir /test

#hadoopfs –ls /

#hadoopfs –put /test/test.txt

若不报错，则说明测试通过

3，Spark测试

1) Spark本地模式测试（Spark Standalone）

#run-exampleorg.apache.spark.examples.SparkPi 100

#spark-submit--class org.apache.spark.examples.JavaWordCount --master spark://node1:6066 --deploy-modecluster /usr/local/spark/lib/spark-examples-1.6.1-hadoop2.6.0.jar ./test.txt

在http://node1:4040中观察输出结果

#spark-submit--class org.apache.spark.examples.JavaWordCount --master spark://node1:6066 --deploy-modecluster /usr/local/spark/lib/spark-examples-1.6.1-hadoop2.6.0.jar hdfs://[hdfsnamespace]/test/test.txt

在http://node1:4040中观察输出结果

2) Spark集群模式测试（Spark on Yarn）

#spark-submit --class org.apache.spark.examples.JavaWordCount--master yarn --deploy-mode client/usr/local/spark/lib/spark-examples-1.6.1-hadoop2.6.0.jar hdfs://[hdfsnamespace]/test/test.txt

#spark-submit --classorg.apache.spark.examples.JavaWordCount --master yarn --deploy-mode cluster/usr/local/spark/lib/spark-examples-1.6.1-hadoop2.6.0.jar hdfs://[hdfsnamespace]/test/test.txt

可通过http://node1:80进入UI界面查看

李天泉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark On Yarn 详细配置流程

1、系统与软件准备系统：centos7软件： hadoop-2.7.2.tar.gz，请勿选择src版本，否则需要自行编译 jdk-7u79-linux-x64.tar.gz scala-2.10.3.tgz spark-1.6.1-bin-hadoop2.6.tgz，选择hadooppre-built版本，否则需要安装后编译 zookeeper-3.3.
复制链接

扫一扫