CentOS7下基于Hadoop2.7.3集群搭建

最新推荐文章于 2022-08-16 14:52:06 发布

sunggff

最新推荐文章于 2022-08-16 14:52:06 发布

阅读量604

点赞数 1

分类专栏： hadoop集群搭建文章标签： CentOS7 Hadoop 集群

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunggff/article/details/64126591

版权

hadoop集群搭建专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、准备工作

1.修改Linux主机名
2.修改IP
3.修改主机名和IP的映射关系
4.关闭防火墙
5.ssh免登陆
6.安装JDK，配置环境变量等

7.集群规划：

主机名 IP 所需安装工具运行进程

hadoop01 220.192.10.10 jdk、hadoop、zookeeper DataNode、NodeManager、JournalNode、QuorumPeerMain

hadoop02 220.192.10.11 jdk、hadoop、zookeeper DataNode、NodeManager、JournalNode、QuorumPeerMain

hadoop03 220.192.10.12 jdk、hadoop、zookeeper DataNode、NodeManager、JournalNode、QuorumPeerMain

hadoop04 220.192.10.13 jdk、hadoop NameNode、DFSZKFailoverController

hadoop05 220.192.10.14 jdk、hadoop NameNode、DFSZKFailoverController

hadoop06 220.192.10.15 jdk、hadoop ResourceManager

hadoop07 220.192.10.16 jdk、hadoop ResourceManager

二、安装

1.在hadoop01上安装并配置zookeeper

1.1 解压zookeeper-3.4.9.tar.gz tar -zxvf zookeeper-3.4.9.tar.gz /hadoop

2.2 进入到conf目录（cd /hadoop/zookeeper-3.4.9/conf/）,修改zoo_sample.cfg文件：mv zoo_sample.cfg zoo.cfg ;vi zoo.cfg

修改dataDir=/hadoop/zookeeper-3.4.9/data，在最后添加

server.1=hadoop01:2888:3888
server.2=hadoop02:2888:3888
server.3=hadoop03:2888:3888

保存后退出，创建tmp文件夹：mkdir /hadoop/zookeeper-3.4.9/tmp ,在创建一个空文件：touch /hadoop/zookeeper-3.4.9/tmp/myid,在myid文件夹中写入ID：1

2.将配置好的zookeeper拷贝到hadoop02、hadoop03上

scp -r /hadoop/zookeeper-3.4.9 hadoop02:/hadoop/

scp -r /hadoop/zookeeper-3.4.9 hadoop03:/hadoop/

修改tmp目录下的myid文件：vi myid，在hadoop02上将1改成2，在hadoop03上改成3,wq保存退出.

3.在hadoop01上安装配置hadoop2.7.3

3.1 解压到hadoop目录下：tar -zxvf hadoop-2.7.3.tar.gz /hadoop

3.2 配置环境变量：

export JAVA_HOME=/usr/java/jdk1.8.0_112
export HADOOP_HOME=/hadoop/hadoop-2.7.3
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

3.3 进入hadoop的etc目录修改配置文件：cd /hadoop/hadoop-2.7.3/etc/hadoop/

3.3.1 修改hadoop-env.sh : export JAVA_HOME=/usr/java/jdk1.8.0_112

3.3.2 修改core-site.xml
<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://ns1</value>
</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/hadoop/hadoop-2.7.3/tmp</value>
</property>

<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
</property>
</configuration>

3.3.3 修改hdfs-site.xml
<configuration>

<property>
<name>dfs.nameservices</name>
<value>ns1</value>
</property>

<property>
<name>dfs.ha.namenodes.ns1</name>
<value>nn1,nn2</value>
</property>

<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>hadoop04:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>hadoop04:50070</value>
</property>

<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>hadoop05:9000</value>
</property>

<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>hadoop05:50070</value>
</property>

<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop01:8485;hadoop02;hadoop03:8485/ns1</value>
</property>

<property>
<name>dfs.journalnode.edits.dir</name>
<value>/hadoop/hadoop-2.7.3/journal</value>
</property>

<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>

<property>
<name>dfs.client.failover.proxy.provider.ns1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>

<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>

<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>

3.3.4 修改mapred-site.xml
<configuration>

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

3.3.5 修改yarn-site.xml
<configuration>

<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>

<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>

<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>

<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>hadoop06</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>hadoop07</value>
</property>

<property>
<name>yarn.resourcemanager.zk-address</name>
<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

3.3.6 修改slaves:slaves是指定子节点的位置，因为要在hadoop04上启动HDFS、在hadoop06启动yarn，所以hadoop04上的slaves文件指定的是datanode的位置，hadoop06上的slaves文件指定的是nodemanager的位置.
vi slaves

hadoop01

hadoop02

hadoop03

3.3.7 配置免密码登陆:在本机生成密钥：ssh-keygen -t rsa

将生成的公钥拷贝到其他节点上：

ssh-copy-id hadoop01

ssh-copy-id hadoop02

ssh-copy-id hadoop03

ssh-copy-id hadoop04

ssh-copy-id hadoop05

ssh-copy-id hadoop06

ssh-copy-id hadoop07

同样步骤在hadoop04，hadoop06上执行。

将hadoop04的公钥拷贝到hadoop05上，将hadoop06的公钥拷贝到hadoop01，hadoop02，hadoop03，hadoop07上。

3.4 将配置好的hadoop拷贝到其他节点

scp -r /hadoop/hadoop-2.7.3 hadoop02:/hadoop/

scp -r /hadoop/hadoop-2.7.3 hadoop03:/hadoop/

scp -r /hadoop/hadoop-2.7.3 hadoop04:/hadoop/

scp -r /hadoop/hadoop-2.7.3 hadoop05:/hadoop/

scp -r /hadoop/hadoop-2.7.3 hadoop06:/hadoop/

scp -r /hadoop/hadoop-2.7.3 hadoop07:/hadoop/

3.5 启动zookeeper集群（分别在hadoop01、hadoop02、hadoop03上启动zk）
cd /hadoop/zookeeper-3.4.9/bin/
./zkServer.sh start
#查看状态：一个leader，两个follower
./zkServer.sh status

3.6 启动journalnode（分别在hadoop01、hadoop02、hadoop03上执行）
cd /hadoop/hadoop-2.7.3/sbin

执行：hadoop-daemon.sh start journalnode

运行jps：在hadoop01、hadoop02、hadoop03上多了JournalNode进程

3.7 格式化HDFS

在hadoop04上执行：hdfs namenode -format 将生成的tmp文件拷贝给hadoop05：scp -r tmp/ hadoop05:/hadoop/hadoop2.7.3

3.8 格式化ZK(在hadoop04上执行即可)
hdfs zkfc -formatZK

3.9 启动HDFS(在hadoop04上执行)
sbin/start-dfs.sh

3.10 启动YARN(注：是在hadoop06上执行start-yarn.sh，把namenode和resourcemanager分开是因为性能问题，因为他们都要占用大量资源，

所以把他们分开了，他们分开了就要分别在不同的机器上启动)

start-yarn.sh

4. 测试

4.1 在浏览器中输入：220.192.10.13:50070

220.192.10.14:50070

4.2 验证HDFS HA

首先向hdfs上传一个文件
hadoop fs -put /etc/profile /profile
hadoop fs -ls /
然后再kill掉active的NameNode
kill -9 2402

通过浏览器访问：220.192.10.13:50070，若状态变为active，且上传的文件还在，则说明配置正确。

将hadoop05的namenode手动启动：hadoop-daemon.sh start namenode

通过浏览器访问：220.192.10.14:50070，状态变为standby。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。