CentOs7下搭载分布式Hadoop2.9

最新推荐文章于 2024-08-08 10:34:27 发布

HyunLevin

最新推荐文章于 2024-08-08 10:34:27 发布

阅读量2.2k

点赞数 1

分类专栏： hadoop 文章标签： centos hadoop 分布式

本文链接：https://blog.csdn.net/lxjzqj2007/article/details/78866250

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文详细介绍了如何在CentOS7环境下搭建Hadoop2.9的分布式集群，包括软件准备、安装步骤、配置SSH无密码登陆、配置Hadoop集群等关键环节，最后成功启动并验证了集群的运行。

摘要由CSDN通过智能技术生成

最近在学习Hadoop,遇到了很多坑，下面讲讲怎么搭载。
(一）软件准备以及前提：
1，三台机器装有cetos7的机子。
2，每台linux系统安装了JDK(我用的JDK1.8)
3，hadoop-2.9.0.tar.gz（包）
以上都可以直接百度怎么安装。
（二）安装步骤：
1，创建用户（三台都要相同）
　　　　进入root : su root
　　　　创建用户hadoop: useradd hadoop
　　　　修改用户密码：passwd hadoop
2.关闭防火墙及修改每台机的hosts
每台机子都按如下修改，红色部分是添加，按格式添加。
vim /etc/hosts

这里写图片描述
查看修改后的机器名字
cat /etc/hostsname
关闭防火墙：
systemctl stop firewalld.service
禁用防火墙：systemctl disable firewalld.service
查看防火墙状态firewall-cmd –state
重启 reboot
3.安装SSH、配置SSH无密码登陆(用新建的用户来创建)
su hadoop
输入登录密码
1) 在master主机生成密钥对
ssh-keygen -t rsa
这个命令生成一个密钥对：id_rsa（私钥文件）和id_rsa.pub（公钥文件）。默认被保存在~/.ssh/目录(如果没有在.ssh生成，可以进入在 ~/.ssh 下执行命令)
2）将公钥复制到从机上，2台从机都要
scp ~/.ssh/id_rsa.pub hadoop@192.168.40.132:/home/hadoop/
登陆从机，将公钥放到authorized_keys目录
cat /home/hadoop/id_rsa.pub >> /hadoop/.ssh/authorized_keys（如果.ssh目录不存在，新建一个）
3)给每台机子添加权限
chmod 700 ~/.ssh
chmod 644 ~/.ssh/authorized_keys
4）测试：
在主机master上登陆从机slave
ssh hadoop@192.168.137.129
如果能切换到slave则表示成功。
注意：在切换到slave1后，如果需要测试登陆slave2的话，需要先返回到master,用命令exit
（三）配置Hadoop集群
1，解压hadoop和建立文件
root用户下：tar zxvf /home/hadoop/hadoop-2.9.0.tar.gz -C /usr/
重命名：mv hadoop-2.7.3 hadoop
授权给hadoop: chown -R hadoop /usr/hadoop
2，创建hdfs相关文件（三台机子都需要操作）
创建存储hadoop数据文件的目录: mkdir /home/hadoopdir
mkdir /home/hadoopdir/tmp
mkdir /home/hadoopdir/dfs
存储临时文件，如pid：mkdir /home/hadoopdir/tmp
创建dfs系统使用的dfs系统名称hdfs-site.xml使用:mkdir /home/hadoopdir/dfs/name
创建dfs系统使用的数据文件hdfs-site.xml文件使用:mkdir /home/hadoopdir/dfs/data
授权给s: chown -R s /home/hadoopdir
3，配置环境变量(三台机子都需要操作）
root用户下：vim /etc/profile

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib/rt.jar:$JRE_HOME/lib
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

保存退出后:source /etc/profile

进入到解压的Hadoop文件的 bin目录，cd /usr/hadoop/bin
执行 ./hadoop vserion 查看版本
这里写图片描述

4，配置hadoop文件内容
cd /usr/hadoop/etc/hadoop
修改 core-site.xml 文件,在configuration添加配置

<configuration>
       <property>
                <name>fs.defaultFS</name>
                <value>hdfs://master:9000</value>
       </property>
       <property>
                <name>io.file.buffer.size</name>
                <value>131072</value>
        </property>
       <property>
               <name>hadoop.tmp.dir</name>
               <value>file:/home/hadoopdir/tmp/</value>
               <description>A base for other temporary   directories.</description>
       </property>
</configuration>

修改hdfs-site.xml文件

<configuration>
     <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:///home/hadoopdir/dfs/name</value>
       </property>
      <property>
              <name>dfs.datanode.data.dir</name>
              <value>file:///home/hadoopdir/dfs/data</value>
       </property>    
</configuration>

修改mapred-site.xml

<configuration>         
<property> 
      <name>mapreduce.framework.name</name>
          <value>yarn</value>
           </property>
          <property>
                  <name>mapreduce.jobhistory.address</name>
                  <value>master:10020</value>
          </property>
          <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>master:19888</value>
       </property>
 <property>
                <name>mapreduce.jobtracker.http.address</name>
                <value>master:50030</value>
       </property>
 <property>
                <name>mapred.job.tracker</name>
                <value>master:9001</value>
       </property>
</configuration>

修改 yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>                                                               
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
               <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
<property>
               <name>yarn.resourcemanager.hostname</name>
               <value>master</value>
       </property>
        <property>
               <name>yarn.resourcemanager.address</name>
               <value>master:8032</value>
       </property>
       <property>
               <name>yarn.resourcemanager.scheduler.address</name>
               <value>master:8030</value>
       </property>
       <property>
            <name>yarn.resourcemanager.resource-tracker.address</name>
             <value>master:8031</value>
      </property>
      <property>
              <name>yarn.resourcemanager.admin.address</name>
               <value>master:8033</value>
       </property>
       <property>
               <name>yarn.resourcemanager.webapp.address</name>
               <value>master:8088</value>
       </property>
</configuration>

修改 slaves文件,同样在这个目录下
添加从机的名字
slave1
slave2
这里写图片描述

5，搭建集群（普通用户hadoop）
格式hadoop文件：hadoop namenode -format (最后出现“util.ExitUtil: Exiting with status 0”，表示成功)

发送dfs内容给slave1:scp -r /home/hadoopdir/dfs/* slave1:/home/hadoopdir/dfs

发给dfs内容给slave2:scp -r /home/hadoopdir/dfs/* slave2:/home/hadoopdir/dfs

发送hadoop文件给数据节点：scp -r /usr/hadoop/* slave1:/usr/hadoop/　　scp -r /usr/hadoop/* slave2:/usr/hadoop/

进入 sbin 启动
cd /usr/hadoop/sbin
./start-all.sh

使用jps 命令查看启动情况（没有这个命令的需要安装 yum install jps*）
master
这里写图片描述
slave

出现这个就成功了。

最后离开安全模式
在master下

cd /usr/hadoop/bin
./hadoop dfsadmin  safemode  leave

可以登录网页查看：http：//master:50070 (查看live node)
查看yarn环境http：//master:8088

本文参考此处1
本文参考此处2

HyunLevin

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录