安装基于hadoop集群的高可用完全分布式的spark高可用集群

最新推荐文章于 2021-11-12 10:15:31 发布

jxx4903049

最新推荐文章于 2021-11-12 10:15:31 发布

阅读量552

点赞数

分类专栏： spark hadoop 文章标签： sparkHA hadoopHA

本文链接：https://blog.csdn.net/jxx4903049/article/details/79469906

版权

spark 同时被 2 个专栏收录

15 篇文章 0 订阅

订阅专栏

hadoop

4 篇文章 0 订阅

订阅专栏

高可用集群规划：

hadoop.xiaoxun.com.cn01 JournalNode QuorumPeerMain NameNode DFSZKFailoverController DataNode NodeManager Master Worker
hadoop.xiaoxun.com.cn02 JournalNode QuorumPeerMain NameNode DFSZKFailoverController DataNode NodeManager Worker
hadoop.xiaoxun.com.cn03 JournalNode QuorumPeerMain DataNode ResourceManager NodeManager Worker
hadoop.xiaoxun.com.cn04 DataNode ResourceManager NodeManager Worker

高可用集群安装步骤：
1.修改Linux主机名
vi /etc/sysconfig/network
2.修改主机名和IP的映射关系hosts文件
vi /etc/hosts
里面要配置的是内网IP地址和主机名的映射关系
3.关闭防火墙
service iptables stop
chkconfig iptables off

创建hadoop新用户并赋予root权限

4.ssh免登陆 --hadoop用户
ssh-keygen -t rsa #用于生成公钥
ssh-copy-id 主机名 #用于将公钥发送到对方的私钥中
在家目录的.ssh文件夹下会看到生成的公钥和私钥

5.安装JDK，scala配置环境变量等
解压到/opt/modules/目录下
# mkdir /opt/modules/
# chown hadoop: hadoop /opt/modules/
第一台安装，拷贝jdk目录给后面两台服务器
$ scp -r jdk1.7.0_67/ hadoop.xiaoxun.com.cn02:/opt/modules/
$ scp -r jdk1.7.0_67/ hadoop.xiaoxun.com.cn03:/opt/modules/
环境变量[3台]
# vi /etc/profile --root用户
## JAVA HOME
JAVA_HOME=/opt/modules/jdk1.7.0_67
export PATH=$PATH:$JAVA_HOME/bin
## SCALA HOME
SCALA_HOME=/opt/modules/scala
export PATH=$PATH:$SCALA_HOME/bin

6.安装配置ZooKeeper
安装：
$ tar -zxvf zookeeper-3.4.5.tar.gz -C /opt/modules/
配置文件：
cd conf/
1)重命名到zoo.cfg
$ mv zoo_sample.cfg zoo.cfg

2)创建zkData文件夹
mkdir zkData

3)修改保存数据的路径
dataDir=/opt/modules/zookeeper-3.4.5/zkData

4)设置ZK服务器的名称和地址
包括一些集群的信息，具体指的是：
服务器编号，服务器地址，LF通信端口，选举端口
格式如下：
server.N=YYY:A:B
N：ZK Server的id
YYY：主机名
A：Leader与Follower之间通信的端口 2888
B：Leader的选举端口 3888

server.1=hadoop.xiaoxun.com.cn01:2888:3888
server.2=hadoop.xiaoxun.com.cn02:2888:3888
server.3=hadoop.xiaoxun.com.cn03:2888:3888

创建myid文件
在（dataDir=/opt/modules/zookeeper-3.4.5/zkData）
创建一个myid文件，里面内容是server.N中的N
（server.1里面内容为1）

将配置好的zk通过scp传到其他服务器
$ scp -r zookeeper-3.4.5/ 192.168.234.102:/opt/modules/
$ scp -r zookeeper-3.4.5/ 192.168.234.103:/opt/modules/

修改myid
192.168.234.102主机上将myid修改为2
192.168.234.103主机上将myid修改为3

启动ZK(逐个启动)
./zkServer.sh start
./zkServer.sh status可以查看到1台是leader，2台follower
并且在一台上的修改会同步到其他2台上。

#####zoo.cfg#####
tickTime=2000
# Zookeeper 服务器之间或客户端与服务器之间维持心跳的
时间间隔，也就是每个 tickTime时间就会发送一个心跳。
tickTime以毫秒为单位。

initLimit=5
# Leader与Follower初始联系的时候，Leader最多能够容忍
Follower的一个tickTime的时间倍数。
在ZK Server刚启动的时候，Leader会等Follower汇报，如果超过了
tickTime*5的时间，还没接到Follower的联系，就认为他出问题了

syncLimit=2
# 在通信过程中，如果超过了2*tickTime的时间，Leader还没有收到
Follower的心跳，就认为出问题了。

dataDir=/opt/modules/zookeeper-3.4.5/zkData
# Zookeeper保存数据的目录，默认情况下，
Zookeeper将写数据的日志文件也保存在这个目录里。

clientPort=2181
# 在ZK启动之后，就会一直监听2181端口，等待客户端的连接。

7.安装hadoop
1.安装hadoop(在第一台上安装)
tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/
删除doc文件
rm -rf doc

2.配置环境变量
#HADOOP_HOME
export HADOOP_HOME=/opt/modules/hadoop-2.5.0
export PATH=$PATH:$HADOOP_HOME/bin

3.配置环境文件
hadoop-env.sh
mapred-env.sh
yarn-env.sh

export JAVA_HOME=/opt/modules/jdk1.7.0_67

4.修改xxxx-site.xml文件

8.安装spark
1.安装spark(在第一台上安装)
tar -zxvf spark -C /opt/modules/
2.配置环境变量
#SPARK_HOME
export SPARK_HOME=/opt/modules/spark
export PATH=$PATH:$SPARK_HOME/bin
3.$SPARK_HOME/conf/spark-env.sh
cp spark-env.sh.template spark-env.sh
#配置内容如下：
export SCALA_HOME=/usr/share/scala
export JAVA_HOME=/usr/java/jdk1.8.0_112/
#export SPARK_MASTER_IP=master(单master)
(HA)export SPARK_DAEMON_JAVA_OPTS=”-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master:2181,slave1:2181,slave2:2181 –Dspark.deploy.zookeeper.dir=/spark”
export SPARK_WORKER_MEMORY=1g
export HADOOP_CONF_DIR=/opt/hadoop-2.7.3/etc/hadoop
4.$SPARK_HOME/conf/slaves
cp slaves.template slaves
master
worker1
worker2
5.scp spark-2.1.0-bin-hadoop2.7 root@workerN:/opt

启动：
在所有节点启动Zkserver
zkServer.sh start
zkServer.sh status
启动journalnode（在master上启动所有journalnode）
hadoop-daemons.sh start journalnode
格式化NameNode
hdfs namenode -format
格式化zkfc
hdfs zkfc -formatZK
在master启动HDFS，Yarn，Spark：
#启动NameNode，DataNode，zkfc，JournalNode
start-dfs.sh
#启动ResouceManager，NodeManager
start-yarn.sh
#启动Master，Worker

start-all.sh

++++++++++++++++++++++++++++++++++++++++

core-site.xml

<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://ns1</value>
</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/opt/modules/hadoop-2.5.0/tmp</value>
</property>
</configuration>

<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop.xiaoxun.com.cn01:2181,hadoop.xiaoxun.com.cn02:2181,hadoop.xiaoxun.com.cn03:2181</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
<description>Size of read/write buffer used inSequenceFiles.</description>
</property>

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

<property>
<name>dfs.nameservices</name>
<value>ns1</value>
</property>


<property>
<name>dfs.ha.namenodes.ns1</name>
<value>nn1,nn2</value>
</property>


<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>hadoop.xiaoxun.com.cn01:9000</value>
</property>


<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>hadoop.xiaoxun.com.cn01:50070</value>
</property>


<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>hadoop.xiaoxun.com.cn02:9000</value>
</property>


<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>hadoop.xiaoxun.com.cn02:50070</value>
</property>


<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop.xiaoxun.com.cn01:8485;hadoop.xiaoxun.com.cn02:8485;hadoop.xiaoxun.com.cn03:8485/ns1</value>
</property>


<property>
<name>dfs.journalnode.edits.dir</name>
<value>/opt/modules/hadoop-2.5.0/journal</value>
</property>


<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>

<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>

<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>

property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>

<property>
<name>dfs.client.failover.proxy.provider.ns1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop.xiaoxun.com.cn04:10020</value>
</property>

<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop.xiaoxun.com.cn04:19888</value>
</property>

<property>
<name>mapreduce.jobhistory.intermediate-done-dir</name>
<value>/home/hadoop/mr_history/HAmap</value>
</property>

<property>
<name>mapreduce.jobhistory.done-dir</name>
<value>/home/hadoop/mr_history/HAdone</value>
<description>Directory where history files are managed by the MR JobHistory Server.</description>

</property>

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

yarn-site.xml

<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>


<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>rmcluster</value>
</property>

<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>

<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>hadoop.xiaoxun.com.cn03</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>hadoop.xiaoxun.com.cn04</value>
</property>


<property>
<name>yarn.resourcemanager.zk-address</name> <value>hadoop.xiaoxun.com.cn01:2181,hadoop.xiaoxun.com.cn02:2181,hadoop.xiaoxun.com.cn03:2181</value>
</property>


<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>


<property>
<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

jxx4903049

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
安装基于hadoop集群的高可用完全分布式的spark高可用集群

高可用集群规划：hadoop.xiaoxun.com.cn01 JournalNode QuorumPeerMain NameNode DFSZKFailoverController DataNode NodeManager Master Workerhadoop.xiaoxun.com.cn02 JournalNode Quor...
复制链接

扫一扫