入门级Hadoop集群搭建详细教程(十一)：Hadoop集群的搭建

最新推荐文章于 2024-08-27 17:34:47 发布

shidan473414

最新推荐文章于 2024-08-27 17:34:47 发布

阅读量951

点赞数

分类专栏： Hadoop 文章标签： java namenode hadoop集群 Linux

本文链接：https://blog.csdn.net/shidan473414/article/details/64922578

版权

Hadoop 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

集群的节点使用虚拟机产生的，本文选择的是4个节点，即一个主节点和三个从节点。其中主节点(master)用于部署NameNode和ResourceManager，其余三个从节点(slave)用于部署DataNode和DataManager。节点的主机名称及对应的IP地址如下表所示：

主机名	ip地址	节点作用
sf-node1.hadoop.com	192.168.1.111	master
sf-node2.hadoop.com	192.168.1.112	slave
sf-node3.hadoop.com	192.168.1.113	slave
sf-node4.hadoop.com	192.168.1.114	slave

为了方便，选择sf-node1.hadoop.com将Hadoop安装配置好，再使用scp命令进行拷贝至其他机器。

1. 安装jdk

由于Hadoop是基于java实现的，因此jdk是必须安装的工具。具体请参见：

入门级Hadoop集群搭建详细教程(八)：JDK、Tomcat的安装

2. 下载Hadoop的版本

这里使用的Hadoop版本是hadoop-2.6.4.下载地址：

https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.6.4/

3. 安装Hadoop

为了统一管理在用户目录下创建一个文件夹apps，用于安装所有的Hadoop组件。

#创建一个新的目录

mkdir apps

#将下载的文件hadoop-2.6.4.tar.gz解压至apps文件夹下，即可完成安装

tar –zxvf hadoop-2.6.4.tar.gz -C apps/

4. 配置SSH免密码登陆

详情见入门级Hadoop集群搭建详细教程(七)：SSH免密码登陆

6. 配置主机与ip地址的映射

#打开hosts文件，配置内容如下：

sudo vi /etc/hosts

192.168.1.111 sf-node1.hadoop.com

192.168.1.112 sf-node2.hadoop.com

192.168.1.113 sf-node3.hadoop.com

192.168.1.114 sf-node4.hadoop.com

为了每次都不用这么麻烦，可以配置一个局部的DNS服务器，这样随着节点的增多，只需要配置下域名服务器即可。具体的DNS搭建方法见：入门级Hadoop集群搭建详细教程(十)：DNS服务器的搭建。本文采用的方法是搭建一个DNS服务器，地址为192.168.1.120。需要配置下域名服务器地址：

[dd171290@sf-node1 ~]$ sudo vi /etc/resolv.conf

nameserver 192.168.1.120

7. 配置相关文件

一个简单的Hadoop集群需要配置如下几个核心文件：hadoop-env.sh 、 core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml，还有一个slaves文件。这些配置文件所在的目录为：apps/hadoop-2.6.4/etc/hadoop/，具体的配置信息如下：

7.1 hadoop-env.sh配置

该文件主要修改下JAVA_HOME。如果你已经配置好了JDK，并且设定了JAVA_HOME变量，可以使用命令：echo $JAVA_HOME 来查看你的jdk安装目录，将hadoop-env.sh文件中的位置修改成如下：

# The java implementation to use.

export JAVA_HOME=/usr/apps/jdk1.8.0_121

7.2 core-site.xml

<name>fs.defaultFS</name> <!—配置hdfs -->

<value>hdfs://sf-node1.hadoop.com:9000</value>

</property>

<name>hadoop.tmp.dir</name><!—配置hadoop临时数据目录 -->

<value>/home/dd171290/apps/hadoop-2.6.4/tmp</value>

</property>

</configuration>