centos7下hadoop3.0高可用HA搭建

最新推荐文章于 2024-07-22 13:23:20 发布

24koby

最新推荐文章于 2024-07-22 13:23:20 发布

阅读量890

点赞数

分类专栏： hadoop学习文章标签： hadoop3.0HA

本文链接：https://blog.csdn.net/qq_31583183/article/details/89575981

版权

hadoop学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1、准备虚拟机四台
192.168.25.160 node01
192.168.25.161 node02
192.168.25.162 node03
192.168.25.163 node04
2、节点角色分配

主机	namenode1	namenode2	datanode	zookeeper	ZKFC	JournalNode
node01	1				1	1
node02		1	1	1	1	1
node03			1	1		1
node03			1	1

3、配置免密登录
对node01进行四台主机的免密登录
生成秘钥
ssh-keygen -t rsa
通过scp将内容写到其他主机文件中
scp -p ~/.ssh/id_rsa.pub root@node01:/root/.ssh/authorized_keys
4、jdk安装
下载jdk1.8
解压jdk资源包到/usr/local/java下
并设置jdk的环境变量

export JAVA_HOME=/usr/java/jdk1.8.0_181
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
export PATH=$PATH:$JAVA_HOME/bin

通过scp命令将jdk和/etc/profile文件分发到其他主机(其他主机jdk路径也为/usr/local/java)
然后执行source /etc/profile使文件生效
执行java -version查看jdk安装是否成功
在这里插入图片描述
5、关闭linux防火墙
对四台主机关闭防火墙
service firewald stop（centos6为service iptables stop）
setenforce 0
chkconfig firewald off
6、同步时间
每台主机都要执行时间同步
ntpdate时间同步
yum install -y ntp
ntpdate 120.25.108.11
120.25.108.11为阿里云提供的时间服务器地址

						zookeeper集群搭建

1、节点主机
node02
node03
node04
2、解压zookeeper.3.4.6.tar.gz到/opt/zookeeper.3.4.6下
tar -zxvf zookeeper.3.4.6.tar.gz -C /opt
3、进入zookeeper的安装文件夹
cd /opt/zookeeper.3.4.6
创建zookeeper的存放数据的文件夹
mkdir data
4、配置zookeeper的环境变量
vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_181
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
export ZOOKEEPER_HOME=/opt/zookeeper.3.4.6
export PATH=$PATH:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin

通过scp命令分发到node03和node04
scp -p /etc/profile root@node03:/etc/profile
5、修改配置文件
cd /opt/zookeeper.3.4.6/conf
先把zoo_sample.cfg改为zoo.cfg
mv zoo_sample.cfg zoo.cfg

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
dataDir=/opt/zookeeper.3.4.6/data
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1
server.1=node02:2888:3888
server.2=node03:2888:3888
server.3=node04:2888:3888

6、分发zookeeper到node03和node04
scp -r /opt/zookeeper.3.4.6 root@node03:/opt
scp -r /opt/zookeeper.3.4.6 root@node04:/opt
7、创建myid文件
server.1=node02:2888:3888
server.2=node03:2888:3888
server.3=node04:2888:3888
根据上面server.(id)中的id号,在zookeeper存放数据的文件夹创建myid文件
cd /opt/zookeeper.3.4.6/data
echo “1” > myid node02
echo “2” > myid node03
echo “3” > myid node04
8、zkServer.sh start启动zookeeper
zkServer.sh status可以查看zookeeper运行状态

						hadoop集群搭建

1、解压hadoop文件
tar -zxvf hadoop…tar.gz -C /opt
mv hadoop… hadoop
2、配置环境变量
vim /etc/profile

    export JAVA_HOME=/usr/java/jdk1.8.0_181
    export PATH=$PATH:$JAVA_HOME/bin
    export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
    export HADOOP_HOME=/opt/hadoop
    export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

其他主机也需要配置此环境变量
3、etc/hadoop下配置hadoop-env.sh文件

export JAVA_HOME=/usr/java/jdk1.8.0_181
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
#export HDFS_SECONDARYNAMENODE_USER=root
export HDFS_ZKFC_USER=root
export HDFS_JOURNALNODE_USER=root

4、etc/hadoop下配置core.site.xml文件

<property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/ha</value>
    </property>
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>node02:2181,node03:2181,node03:2181</value>
    </property>

5、etc/hadoop下配置hdfs.site.xml文件

<property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
         <name>dfs.nameservices</name>
        <value>mycluster</value>
    </property>
    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>node01:9820</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>node02:9820</value>
    </property><property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>node01:9870</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
         <value>node02:9870</value>
    </property>
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://node01:8485;node02:8485;node03:8485/mycluster</value>
    </property>
    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
    </property>
    <property>
      <name>dfs.ha.fencing.ssh.private-key-files</name>
      <value>/root/.ssh/id_rsa</value>
    </property>
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/ha/journalode</value>
    </property>
    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>

6、etc/hadoop下配置yarn.site.xml文件

<property>
        <name>mapreduce.application.classpath</name>
        <value>/opt/hadoop/etc/hadoop:/opt/hadoop/share/hadoop/common/lib/*:/opt/hadoop/share/hadoop/common/*:/opt/hadoop/share/hadoop/hdfs:/opt/hadoop/share/hadoop/hdfs/lib/*:/opt/hadoop/share/hadoop/hdfs/*:/opt/hadoop/share/hadoop/mapreduce/*:/opt/hadoop/share/hadoop/yarn:/opt/hadoop/share/hadoop/yarn/lib/*:/opt/hadoop/share/hadoop/yarn/*</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
<property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
 </property>
 <property>
   <name>yarn.resourcemanager.cluster-id</name>
   <value>node02</value>
 </property>
 <property>
   <name>yarn.resourcemanager.ha.rm-ids</name>
   <value>rm1,rm2</value>
 <property>
   <name>yarn.resourcemanager.hostname.rm1</name>
   <value>node03</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm2</name>
   <value>node04</value>
 </property>
 <property>
   <name>yarn.resourcemanager.zk-address</name>
   <value>node02:2181,node03:2181,node04:2181</value>
 </property>
<property>
  <name>yarn.resourcemanager.webapp.address.rm1</name>
  <value>node03:8088</value>
</property>
<property>
  <name>yarn.resourcemanager.webapp.address.rm2</name>
  <value>node04:8088</value>
</property>

7、etc/hadoop下配置mapred.site.xml文件

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
  </property>

8、etc/hadoop下配置slaves文件
这个文件指定了datanode节点的主机

node02
node03
node04

9、通过scp将hadoop的安装文件分发到其他机器上去
scp -r /opt/hadoop root@node02:/opt
10、格式化hdfs文件系统
hdfs namenode -format
11、启动hadoop
执行start-dfs.sh打开namenode,datanode节点，浏览器打开：192.168.25.161:9870登录namenode界面
执行start-yarn.sh启动resourceManager，浏览器192.168.25.163:8088查看
12、测试hadoop
现在linux下创建一个文件test.txt
vim test.txt并插入一些字符串
然后将test.txt上传至hdfs
hadoop fs -put test.txt /hello/test.txt
然后进行wordcount测试
进入hadoop安装目录
执行一下命令
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /hello/test.txt /hello/count
控制台查看
在这里插入图片描述
从控制台可看到运行成功

从resourcemanager也可以看到运行成功。