Hadoop安装之高可用搭建

最新推荐文章于 2024-05-02 20:59:28 发布

徐川江的个人博客

最新推荐文章于 2024-05-02 20:59:28 发布

阅读量615

点赞数 2

分类专栏： bigdata 文章标签： hadoop高可用安装

本文链接：https://blog.csdn.net/qq_15076569/article/details/84185610

版权

bigdata 专栏收录该内容

17 篇文章 1 订阅

订阅专栏

通过前面两篇文章的搭建，可以发现搭建的NameNode只有一台，没有进行备份机，如果NameNode宕机了，那整个集群也就废了，所以我们需要在另外的机器上再搭建一个NameNode节点，且使用JournalNode来保证两台NameNode中的元数据保持一致，并且还需要通过zookeeper的zkFailoverController守护进程来监控NameNode的健康状况，一旦其中active的NameNode宕机了，立刻切换到另外一台NameNode。

集群运行服务规划

	192.168.254.100	192.168.254.110	192.168.254.120
zookeeper	zk	zk	zk
HDFS	JournalNode	JournalNode	JournalNode
	NameNode	NameNode
	ZKFC	ZKFC
	DataNode	DataNode	DataNode
YARN		ResourceManager	ResourceManager
YARN	NodeManager	NodeManager	NodeManager
MapReduce			JobHistoryServer

三台服务配置主机名：

100为node01

110为node02

120为node03

一：安装

在100的机器上进行解压安装

mkdir -p /export/softwares

mkdir -p /export/servers

cd /export/softwares

tar -zxvf hadoop-2.7.5.tar.gz -C ../servers/

二：修改配置文件

1)修改core-site.xml

cd /export/servers/hadoop-2.7.5/etc/hadoop

vim core-site.xml

<configuration>



<property>

<name>ha.zookeeper.quorum</name>

<value>node01:2181,node02:2181,node03:2181</value>

</property>



<property>

<name>fs.defaultFS</name>

<value>hdfs://ns</value>

</property>



<property>

<name>hadoop.tmp.dir</name>

<value>/export/servers/hadoop-2.7.5/data/tmp</value>

</property>



<property>

<name>fs.trash.interval</name>

<value>10080</value>

</property>

</configuration>

2)修改hdfs-site.xml

cd /export/servers/hadoop-2.7.5/etc/hadoop

vim hdfs-site.xml

<configuration>



<property>

<name>dfs.nameservices</name>

<value>ns</value>

</property>



<property>

<name>dfs.ha.namenodes.ns</name>

<value>nn1,nn2</value>

</property>



<property>

<name>dfs.namenode.rpc-address.ns.nn1</name>

<value>node01:8020</value>

</property>



<property>

<name>dfs.namenode.rpc-address.ns.nn2</name>

<value>node02:8020</value>

</property>



<property>

<name>dfs.namenode.servicerpc-address.ns.nn1</name>

<value>node01:8022</value>

</property>



<property>

<name>dfs.namenode.servicerpc-address.ns.nn2</name>

<value>node02:8022</value>

</property>



<property>

<name>dfs.namenode.http-address.ns.nn1</name>

<value>node01:50070</value>

</property>



<property>

<name>dfs.namenode.http-address.ns.nn2</name>

<value>node02:50070</value>

</property>



<property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://node01:8485;node02:8485;node03:8485/ns1</value>

</property>



<property>

<name>dfs.client.failover.proxy.provider.ns</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>



<property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>



<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/root/.ssh/id_rsa</value>

</property>



<property>

<name>dfs.journalnode.edits.dir</name>

<value>/export/servers/hadoop-2.7.5/data/dfs/jn</value>

</property>



<property>

<name>dfs.ha.automatic-failover.enabled</name>

<value>true</value>

</property>



<property>

<name>dfs.namenode.name.dir</name>

<value>file:///export/servers/hadoop-2.7.5/data/dfs/nn/name</value>

</property>



<property>

<name>dfs.namenode.edits.dir</name>

<value>file:///export/servers/hadoop-2.7.5/data/dfs/nn/edits</value>

</property>



<property>

<name>dfs.datanode.data.dir</name>

<value>file:///export/servers/hadoop-2.7.5/data/dfs/dn</value>

</property>



<property>

<name>dfs.permissions</name>

<value>false</value>

</property>



<property>

<name>dfs.blocksize</name>

<value>134217728</value>

</property>

</configuration>

3）修改yarn-site.xml

cd /export/servers/hadoop-2.7.5/etc/hadoop

vim yarn-site.xml

<configuration>











<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>



<property>

        <name>yarn.resourcemanager.ha.enabled</name>

        <value>true</value>

</property>



<property>

        <name>yarn.resourcemanager.cluster-id</name>

        <value>mycluster</value>

</property>



<property>

        <name>yarn.resourcemanager.ha.rm-ids</name>

        <value>rm1,rm2</value>

</property>



<property>

        <name>yarn.resourcemanager.hostname.rm1</name>

        <value>node03</value>

</property>



<property>

        <name>yarn.resourcemanager.hostname.rm2</name>

        <value>node02</value>

</property>



<property>

        <name>yarn.resourcemanager.address.rm1</name>

        <value>node03:8032</value>

</property>

<property>

        <name>yarn.resourcemanager.scheduler.address.rm1</name>

        <value>node03:8030</value>

</property>

<property>

        <name>yarn.resourcemanager.resource-tracker.address.rm1</name>

        <value>node03:8031</value>

</property>

<property>

        <name>yarn.resourcemanager.admin.address.rm1</name>

        <value>node03:8033</value>

</property>

<property>

        <name>yarn.resourcemanager.webapp.address.rm1</name>

        <value>node03:8088</value>

</property>



<property>

        <name>yarn.resourcemanager.address.rm2</name>

        <value>node02:8032</value>

</property>

<property>

        <name>yarn.resourcemanager.scheduler.address.rm2</name>

        <value>node02:8030</value>

</property>

<property>

        <name>yarn.resourcemanager.resource-tracker.address.rm2</name>

        <value>node02:8031</value>

</property>

<property>

        <name>yarn.resourcemanager.admin.address.rm2</name>

        <value>node02:8033</value>

</property>

<property>

        <name>yarn.resourcemanager.webapp.address.rm2</name>

        <value>node02:8088</value>

</property>



<property>

        <name>yarn.resourcemanager.recovery.enabled</name>

        <value>true</value>

</property>



<property>

<name>yarn.resourcemanager.ha.id</name>

<value>rm1</value>

       <description>If we want to launch more than one RM in single node, we need this configuration</description>

</property>



   

<property>

        <name>yarn.resourcemanager.store.class</name>

        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

</property>

<property>

        <name>yarn.resourcemanager.zk-address</name>

        <value>node02:2181,node03:2181,node01:2181</value>

        <description>For multiple zk services, separate them with comma</description>

</property>



<property>

        <name>yarn.resourcemanager.ha.automatic-failover.enabled</name>

        <value>true</value>

        <description>Enable automatic failover; By default, it is enabled only when HA is enabled.</description>

</property>

<property>

        <name>yarn.client.failover-proxy-provider</name>

        <value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value>

</property>



<property>

        <name>yarn.nodemanager.resource.cpu-vcores</name>

        <value>4</value>

</property>



<property>

        <name>yarn.nodemanager.resource.memory-mb</name>

        <value>512</value>

</property>



<property>

        <name>yarn.scheduler.minimum-allocation-mb</name>

        <value>512</value>

</property>



<property>

        <name>yarn.scheduler.maximum-allocation-mb</name>

        <value>512</value>

</property>



<property>

        <name>yarn.log-aggregation.retain-seconds</name>

        <value>2592000</value>

</property>



<property>

        <name>yarn.nodemanager.log.retain-seconds</name>

        <value>604800</value>

</property>



<property>

        <name>yarn.nodemanager.log-aggregation.compression-type</name>

        <value>gz</value>

</property>



<property>

        <name>yarn.nodemanager.local-dirs</name>

        <value>/export/servers/hadoop-2.7.5/yarn/local</value>

</property>



<property>

        <name>yarn.resourcemanager.max-completed-applications</name>

        <value>1000</value>

</property>



<property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

</property>



<property>

        <name>yarn.resourcemanager.connect.retry-interval.ms</name>

        <value>2000</value>

</property>

</configuration>

4）修改mapred-site.xml

cd /export/servers/hadoop-2.7.5/etc/hadoop

vim mapred-site.xml

<configuration>



<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

</property>



<property>

        <name>mapreduce.jobhistory.address</name>

        <value>node03:10020</value>

</property>



<property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>node03:19888</value>

</property>



<property>

        <name>mapreduce.jobtracker.system.dir</name>

        <value>/export/servers/hadoop-2.7.5/data/system/jobtracker</value>

</property>



<property>

        <name>mapreduce.map.memory.mb</name>

        <value>1024</value>

</property>





<property>

        <name>mapreduce.reduce.memory.mb</name>

        <value>1024</value>

</property>





<property>

        <name>mapreduce.task.io.sort.mb</name>

        <value>100</value>

</property>





<property>

        <name>mapreduce.task.io.sort.factor</name>

        <value>10</value>

</property>



<property>

        <name>mapreduce.reduce.shuffle.parallelcopies</name>

        <value>25</value>

</property>

<property>

        <name>yarn.app.mapreduce.am.command-opts</name>

        <value>-Xmx1024m</value>

</property>



<property>

        <name>yarn.app.mapreduce.am.resource.mb</name>

        <value>1536</value>

</property>



<property>

        <name>mapreduce.cluster.local.dir</name>

        <value>/export/servers/hadoop-2.7.5/data/system/local</value>

</property>

</configuration>

5）修改slaves

cd /export/servers/hadoop-2.7.5/etc/hadoop

vim slaves

node01

node02

node03

6）修改hadoop-env.sh

cd /export/servers/hadoop-2.7.5/etc/hadoop

vim hadoop-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_141

三：拷贝hadoop到110和120机器上

cd /export/servers

scp -r hadoop-2.7.5/ node02:$PWD

scp -r hadoop-2.7.5/ node03:$PWD

三台机器100、110、120分别执行

mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/name

mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/edits

mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/name

mkdir -p /export/servers/hadoop-2.7.5/data/dfs/nn/edits

进入110机器，进入hadoop2.7.5中修改yarn-site.xml

<property>

<name>yarn.resourcemanager.ha.id</name>

<value>rm2</value>

       <description>If we want to launch more than one RM in single node, we need this configuration</description>

</property>

四：启动HDFS

在100机器上执行

cd /export/servers/hadoop-2.7.5

bin/hdfs zkfc -formatZK

sbin/hadoop-daemons.sh start journalnode

bin/hdfs namenode -format

bin/hdfs namenode -initializeSharedEdits -force

sbin/start-dfs.sh

在110机器上执行