centos7下搭建hadoop-2.7.2集群

最新推荐文章于 2024-09-01 21:08:00 发布

chongshang8096

最新推荐文章于 2024-09-01 21:08:00 发布

阅读量83

点赞数

文章标签：大数据运维 java

原文链接：https://my.oschina.net/asdqwe/blog/652549

版权

网上有一些关键搭建集群的例子，有些可能不够详细，有些关键点略过了。为了让搭建者少走弯路，写一遍够详细的部署文档，供大家参考。

关键步骤：1.主机Master一台，节点分机两台。配置主机Master可以无密码SSH登录到节点分机。2.解压JDK，解压安装Hadoop，配置hdfs，mapreduce等主从关系。3.配置初始化，服务启动，检查环境运行情况。

详细安装：

环境准备，3台64位的Centos7，64位linux版的Hadoop2.7.2，64位linux版JDK7以上。
Master：192.168.89.136
Slave1：192.168.89.134
Slave2：192.168.89.135
必须修改Hosts文件，哪怕所有配置文件都用IP也不行，不然最后会启动不了服务。修改三台机器： vi /etc/hosts
192.168.89.136 hadoop01
192.168.89.134 hadoop02
192.168.89.135 hadoop03

3. SSH免密码登录：因为Hadoop需要通过SSH登录到各个节点进行操作，我用的是root用户，每台服务器都生成公钥，再合并到authorized_keys
(1)每台服务器都要设置：CentOS7默认没有启动ssh无密登录，去掉/etc/ssh/sshd_config其中2行的注释。
#RSAAuthentication yes
#PubkeyAuthentication yes
(2)每台服务器都要设置：输入命令，ssh-keygen -t rsa，生成key，都不输入密码，一直回车，/root就会生成.ssh文件夹。
(3)合并公钥到authorized_keys文件：在Master服务器上，进入/root/.ssh目录，通过SSH命令合并，
cat id_rsa.pub>> authorized_keys 生成 authorized_keys文件。
ssh root@192.168.89.134 cat ~/.ssh/id_rsa.pub>> authorized_keys
ssh root@192.168.89.135 cat ~/.ssh/id_rsa.pub>> authorized_keys

(4)把Master服务器的authorized_keys、known_hosts复制到Slave服务器的/root/.ssh目录

scp authorized_keys root@192.168.89.134:/root/.ssh/

scp known_hosts root@192.168.89.134:/root/.ssh/

scp authorized_keys root@192.168.89.135:/root/.ssh/

scp known_hosts root@192.168.89.135:/root/.ssh/

(5)完成。ssh root@192.168.89.134、ssh root@192.168.89.135就不需要输入密码了。

4.三台机器安装JDK，也可以解压主机后，scp到分机。Hadoop2.7.2需要JDK7，直接解压下载的JDK并配置变量即可。
(1)下载"jdk-7u79-linux-x64.gz"，放到/home/java目录下
(2)解压，输入命令，tar -zxvf jdk-7u79-linux-x64.gz
(3)编辑/etc/profile
export JAVA_HOME=/home/java/jdk1.7.0_79
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin
(4)使配置生效，输入命令，source /etc/profile
(5)输入命令，java -version，完成。

5.安装Hadoop2.7，Master服务器解压并安装。
(1)下载“hadoop-2.7.0.tar.gz”，放到/home/hadoop目录下。
(2)解压，输入命令，tar -xzvf hadoop-2.7.0.tar.gz，/home/hadoop下会多一个hadoop-2.7.2目录。
(3)在/home/hadoop/hadoop-2.7.2目录下创建数据存放的文件夹，tmp、dfs、dfs/data、dfs/name。之所以把文件夹创建在这里，方便以后步骤中配置和一次性拷贝到分机。

6.配置hadoop的配置文件信息，一共有四个配置文件，里面的IP地址全部设置成Master机器的IP地址即可。其中有一个xml文件查不到，因为是template结尾的，mv修改一下文件名，或者重新建一个xml文件都可以。四个文件都是都包含site字样。

(1)配置/home/hadoop/hadoop-2.7.2/etc/hadoop目录下的core-site.xml文件

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/home/hadoop/hadoop-2.7.2/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

</configuration>

(2)配置/home/hadoop/hadoop-2.7.2/etc/hadoop目录下的hdfs-site.xml文件

<name>dfs.namenode.name.dir</name>

<value>file:/home/hadoop/hadoop-2.7.2/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/hadoop/hadoop-2.7.2/dfs/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.namenode.secondary.http-address</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

</configuration>

(3)配置/home/hadoop/hadoop-2.7.2/etc/hadoop目录下的mapred-site.xml文件

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

(4)配置/home/hadoop/hadoop-2.7.2/etc/hadoop目录下的yarn-site.xml文件。

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.admin.address</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

</configuration>

7.配置三台机器：在/home/hadoop/hadoop-2.7.2/etc/hadoop目录下hadoop-env.sh、yarn-env.sh的JAVA_HOME，不设置的话，启动不了。这里必须在文件的最开始设置，环境变量不起作用的。
export JAVA_HOME=/home/java/jdk1.7.0_79

8.配置主机Mster：/home/hadoop/hadoop-2.7.2/etc/hadoop目录下的slaves，删除默认的localhost，增加3个IP，一个主机ip，两个节点ip：

192.168.89.136

192.168.89.134

192.168.89.135

9.在Master服务器上进行初始化操作，到/home/hadoop/hadoop-2.7.2/目录下：
初始化，输入命令，bin/hdfs namenode -format

10.主机Master的hadoop初始化结束后，将配置好的Hadoop复制到各个节点对应位置上，通过scp传送，
scp -r /home/hadoop 192.168.89.134:/home/
scp -r /home/hadoop 192.168.89.135:/home/

11.在Master服务器启动hadoop，从节点会自动启动:

(1)到主机Master/home/hadoop/hadoop-2.7.2/目录下

(2)全部启动sbin/start-all.sh，也可以分开sbin/start-dfs.sh、sbin/start-yarn.sh

(3)停止的话，输入命令，sbin/stop-all.sh

(4)输入命令，jps，可以看到相关服务信息。

主机服务：

23246 NameNode

19370 JobHistoryServer

23348 DataNode

28364 Jps

23720 ResourceManager

23523 SecondaryNameNode

分机服务：

12330 DataNode

16078 Jps

12.Web访问，要先开放端口或者直接关闭防火墙，三台机器都关闭。
(1)输入命令，systemctl stop firewalld.service
(2)浏览器打开http://192.168.89.136:8088/
(3)浏览器打开http://192.168.89.136:50070/

在http://192.168.89.136:50070/下的Overview找到Live Nodes 数是3，证明有3个节点是存活的。

以上Hadoop集群的全部搭建就完成了。

解决问题不是目的，学习解决的过程和培养善于发现问题的能力。

转载于:https://my.oschina.net/asdqwe/blog/652549

chongshang8096

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
centos7下搭建hadoop-2.7.2集群

网上有一些关键搭建集群的例子，有些可能不够详细，有些关键点略过了。为了让搭建者少走弯路，写一遍够详细的部署文档，供大家参考。关键步骤：1.主机Master一台，节点分机两台。配置主机Master可以无密码SSH登录到节点分机。2.解压JDK，解压安装Hadoop，配置hdfs，mapredu...
复制链接

扫一扫