Hadoop2集群搭建

最新推荐文章于 2022-11-23 14:50:51 发布

扎古摩羯

最新推荐文章于 2022-11-23 14:50:51 发布

阅读量436

点赞数

分类专栏： Hadoop

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在这里我们选用4台机器进行示范，各台机器的职责如下表格所示

	master	slave1	slave 2	slave 3
是NameNode吗?	是，属集群cluster1	是，属集群cluster1	是，属集群cluster2	是，属集群cluster2
是DataNode吗？	否	是	是	是
是JournalNode吗？	是	是	是	否
是ZooKeeper吗？	是	是	是	否
是ZKFC吗?	是	是	是	是

搭建自动HA

A. 复编制译后的hadoop项目到/usr/local目录下

B. 修改位于etc/hadoop目录下的配置文件

a) hadoop-env.sh

export JAVA_HOME=/usr/local/Java/jdk7

b) core-site.xml

<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster1</value>
</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.6.3/tmp</value>
</property>

<property>
<name>ha.zookeeper.quorum</name>
<value>master:2181,slave1:2181,slave2:2181</value>
</property>

</configuration>

c) hdfs-site.xml

<property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>

<property>
       <name>dfs.nameservices</name>
       <value>cluster1,cluster2</value>
    </property>

<property>
       <name>dfs.ha.namenodes.cluster1</name>
        <value>master,slave1</value>
    </property>

<property>
        <name>dfs.namenode.rpc-address.cluster1.master</name>
        <value>master:9000</value>
    </property>

<property>
       <name>dfs.namenode.http-address.cluster1. master </name>
        <value> master:50070</value>
    </property>

<property>
       <name>dfs.namenode.rpc-address.cluster1.slave1</name>
        <value> slave1:9000</value>
    </property>

<property>
       <name>dfs.namenode.http-address.cluster1. slave1</name>
        <value> slave1:50070</value>
    </property>

      <property>
       <name>dfs.namenode.shared.edits.dir</name>
           <value>qjournal://hadoop0:8485;hadoop1:8485;hadoop2:8485/cluster1</value>
    </property>

<property>
       <name>dfs.ha.automatic-failover.enabled.cluster1</name>
        <value>true</value>
    </property>

<property>
<name>dfs.client.failover.proxy.provider.cluster1</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<property>
       <name>dfs.ha.namenodes.cluster2</name>
        <value>slave2,slave3</value>
   </property>

   <property>
       <name>dfs.namenode.rpc-address.cluster2. slave2</name>
        <value> slave2:9000</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.cluster2.slave2</name>
        <value> slave2:50070</value>
    </property>
    <property>
       <name>dfs.namenode.rpc-address.cluster2. slave3</name>
        <value> slave3:9000</value>
    </property>

<property>
        <name>dfs.namenode.http-address.cluster2.slave3</name>
        <value> slave3:50070</value>
    </property>

<property>
       <name>dfs.ha.automatic-failover.enabled.cluster2</name>
        <value>true</value>
</property>
<property>
    <name>dfs.client.failover.proxy.provider.cluster2</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<property>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/hadoop-2.6.3/tmp/journal</value>
</property>

<property>
       <name>dfs.ha.fencing.methods</name>
       <value>sshfence</value>
    </property>

   <property>
       <name>dfs.ha.fencing.ssh.private-key-files</name>
       <value>/root/.ssh/id_rsa</value>
    </property>

</configuration>

d) 修改配置文件slaves，添加datanode节点域名

slave1

slave2

slave3

C. 把以上配置的内容复制到slave 1、slave 2、slave 3节点上

D. 修改cluster2集群上的节点slave2、slave3的配置文件内容

a) 修改slave2上的core-site.xml

fs.defaultFS的值改为hdfs://cluster2

b) 修改slave2上的hdfs-site.xml内容

把cluster1中关于journalnode的配置项删除，在配置地址属性下增加如下内容

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://master:8485; slave1:8485; slave2:8485/cluster2</value>

</property>

开始启动

A. 首先启动zookeeper集群

在master、slave1、slave2上执行zkServer.sh start

B. 启动journalnode

在master、slave1、slave2上执行sbin/hadoop-daemon.sh startjournalnode

C. 格式化ZooKeeper

在不同集群cluster1，cluster2的namenode节点(master，slave2) 执行bin/hdfs zkfc -formatZK

D. 对master节点进行格式化和启动

bin/hdfs namenode -format

sbin/hadoop-daemon.sh start namenode

E. 对slave1节点进行格式化和启动

bin/hdfs namenode -bootstrapStandby

sbin/hadoop-daemon.sh start namenode

F. 在cluster1集群机器master、slave1上启动zkfc

sbin/hadoop-daemon.sh start zkfc

<!—cluster1集群上的master，slave1中某个节点就会变为active状态。-->

对于cluster2执行类似D-F操作

A. 启动datanode

在master上执行命令sbin/hadoop-daemons.sh start datanode

B. 配置Yarn

a) 修改文件mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

b) 修改文件yarn-site.xml

<property>
   <name>yarn.resourcemanager.hostname</name>
    <value>master</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

C. 启动yarn

在master上执行sbin/start-yarn.sh

扎古摩羯

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop2集群搭建

在这里我们选用4台机器进行示范，各台机器的职责如下表格所示 masterslave1slave 2slave 3是NameNode吗?是，属集群cluster1是，属集群cluster1是，属集群cluster2是，属集群cluster2是Da
复制链接

扫一扫