03 - hadoop3.1.3运行环境搭建

本文详细介绍了如何从零开始搭建Hadoop集群,包括模板虚拟机环境准备、虚拟机克隆、JDK与Hadoop的安装、配置以及Hadoop目录结构解析。主要内容涉及网络配置、用户权限设置、JDK与Hadoop的安装与环境变量配置,并展示了Hadoop的重要目录结构。
摘要由CSDN通过智能技术生成

目录

1、模板虚拟机环境准备

 2、克隆虚拟机

3、在hadoop102上面安装JDK

4、在hadoop102安装Hadoop

5、Hadoop目录结构


1、模板虚拟机环境准备

0)安装模板虚拟机,IP 地址 192.168.10.100、主机名称 hadoop100、内存 4G、硬盘 50G

1)hadoop100 虚拟机配置要求如下

  • 使用 yum 安装需要虚拟机可以正常上网,yum 安装前可以先测试下虚拟机联网情况
    [root@hadoop100 ~]# ping www.baidu.com
    PING www.baidu.com (14.215.177.39) 56(84) bytes of data.
    64 bytes from 14.215.177.39 (14.215.177.39): icmp_seq=1 ttl=128 time=8.60 ms
    64 bytes from 14.215.177.39 (14.215.177.39): icmp_seq=2 ttl=128 time=7.72 ms
    
  • 安装epel-release
    注:Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。相当于是一个软件仓库,大多数rpm包在官方 repository 中是找不到的)
    [root@hadoop100 ~]# yum install -y epel-release
    
  • 注意:如果Linux安装的是最小系统版,还需要安装如下工具;如果安装的是Linux桌面标准版,不需要执行如下操作
    net-tool:工具包集合,包含ifconfig等命令
    [root@hadoop100 ~]# yum install -y net-tools 
    

    vim:编辑器

    [root@hadoop100 ~]# yum install -y vim
    

2)关闭防火墙,关闭防火墙开机自启

[root@hadoop100 ~]# systemctl stop firewalld
[root@hadoop100 ~]# systemctl disable firewalld.service

注意:在企业开发时,通常单个服务器的防火墙时关闭的。公司整体对外会设置非常安全的防火墙

3)创建kgf用户,并修改用户的密码(之前创建了的就不用创建)

[root@hadoop100 ~]# useradd kgf
[root@hadoop100 ~]# passwd 12356

4)配置kgf用户具有root权限,方便后期加sudo执行root权限的命令

[root@hadoop100 ~]# vim /etc/sudoers

注意:kgf这一行不要直接放到root行下面,因为所有用户都属于wheel组,你先配置了kgf具有免密功能,但是程序执行到%wheel行时,该功能又被覆盖回需要密码。所以kgf要放到%wheel这行下面

5)在/opt目录下创建文件夹,并修改所属主和所属组

  • 在/opt目录下创建module、software文件夹
    [root@hadoop100 ~]# mkdir /opt/module
    [root@hadoop100 ~]# mkdir /opt/software
    
  • 修改module、software文件夹的所有者和所属组均为kgf用户
    [root@hadoop100 ~]# chown kgf:kgf /opt/module 
    [root@hadoop100 ~]# chown kgf:kgf /opt/software
    
  • 查看module、software文件夹的所有者和所属组

6)卸载虚拟机自带的JDK 。注意:如果你的虚拟机是最小化安装不需要执行这一步。

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps 
  • rpm -qa:查询所安装的所有rpm软件包
  • grep -i:忽略大小写
  • xargs -n1:表示每次只传递一个参数
  • rpm -e –nodeps:强制卸载软件

7)重启虚拟机

[root@hadoop100 ~]# reboot

 2、克隆虚拟机

1)利用模板机hadoop100,克隆三台虚拟机:hadoop102 hadoop103 hadoop104

注意:克隆时,要先关闭hadoop100

  • 关机后,右键 》 管理 》 克隆

  • 选择创建完整克隆

  • 修改虚拟机名称

  •  克隆完成

2)修改克隆机IP,以下以hadoop102举例说明

  • 1.修改克隆虚拟机的静态IP
[root@hadoop100 ~]# vim /etc/sysconfig/network-scripts/ifcfg-ens33

改成

DEVICE=ens33
TYPE=Ethernet
ONBOOT=yes
BOOTPROTO=static
NAME="ens33"
IPADDR=192.168.10.102
PREFIX=24
GATEWAY=192.168.10.2
DNS1=192.168.10.2
  • 2.查看Linux虚拟机的虚拟网络编辑器,编辑->虚拟网络编辑器->VMnet8

  • 3.查看Windows系统适配器VMware Network Adapter VMnet8的IP地址

  • 4.保证Linux系统ifcfg-ens33文件中IP地址、虚拟网络编辑器地址和Windows系统VM8网络IP地址相同

3)修改克隆机主机名,以下以hadoop102举例说明

  • 1.修改主机名称
[root@hadoop100 ~]# vim /etc/hostname
hadoop102
  • 2.配置Linux克隆机主机名称映射hosts文件,打开/etc/hosts(根据上一篇文章配置了小伙伴可以不弄了!
[root@hadoop100 ~]# vim /etc/hosts

添加如下内容

192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
192.168.10.105 hadoop105
192.168.10.106 hadoop106
192.168.10.107 hadoop107
192.168.10.108 hadoop108

4)重启克隆机hadoop102

[root@hadoop100 ~]# reboot

3、在hadoop102上面安装JDK

1)卸载现有JDK
注意:安装JDK前,一定确保提前删除了虚拟机自带的JDK。(之前卸载了的就不用卸载了)

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

2)用XShell传输工具将JDK导入到opt目录下面的software文件夹下面

3)在Linux系统下的opt目录中查看软件包是否导入成功

[ovo@hadoop102 ~]$ ls /opt/software/

看到如下结果:

4)解压JDK到/opt/module目录下

[kgf@hadoop102 software]$ tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/

5)配置JDK环境变量

  • 1.新建/etc/profile.d/my_env.sh文件
[kgf@hadoop102 software]$ sudo vim /etc/profile.d/my_env.sh

添加如下内容

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin
  • 2.保存后退出
:wq
  • 3.source一下/etc/profile文件,让新的环境变量PATH生效
[kgf@hadoop102 software]$ source /etc/profile

6)测试JDK是否安装成功

[kgf@hadoop102 software]$ java -version
java version "1.8.0_212"
Java(TM) SE Runtime Environment (build 1.8.0_212-b10)
Java HotSpot(TM) 64-Bit Server VM (build 25.212-b10, mixed mode)
[kgf@hadoop102 software]$

4、在hadoop102安装Hadoop

1)用XShell文件传输工具将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面(和刚才拖拽JDK一样就不截图了)

2)进入到Hadoop安装包路径下

[kgf@hadoop102 ~]$ cd /opt/software/

3)解压安装文件到/opt/module下面

[kgf@hadoop102 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/

4)查看是否解压成功

[kgf@hadoop102 software]$ ls /opt/module/
hadoop-3.1.3

5)将Hadoop添加到环境变量

[kgf@hadoop102 hadoop-3.1.3]$ pwd
/opt/module/hadoop-3.1.3
  • 2.打开/etc/profile.d/my_env.sh文件
[kgf@hadoop102 hadoop-3.1.3]$ sudo vim /etc/profile.d/my_env.sh

在my_env.sh文件末尾添加如下内容:(shift+g)

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

保存并退出: :wq

  • 3.让修改后的文件生效
[kgf@hadoop102 hadoop-3.1.3]$ source /etc/profile

6)测试是否安装成功

[kgf@hadoop102 hadoop-3.1.3]$ hadoop version
Hadoop 3.1.3

5、Hadoop目录结构

1)查看Hadoop目录结构

[kgf@hadoop102 hadoop-3.1.3]$ ll
总用量 176
drwxr-xr-x. 2 kgf kgf    183 9月  12 2019 bin
drwxr-xr-x. 3 kgf kgf     20 9月  12 2019 etc
drwxr-xr-x. 2 kgf kgf    106 9月  12 2019 include
drwxr-xr-x. 3 kgf kgf     20 9月  12 2019 lib
drwxr-xr-x. 4 kgf kgf    288 9月  12 2019 libexec
-rw-rw-r--. 1 kgf kgf 147145 9月   4 2019 LICENSE.txt
-rw-rw-r--. 1 kgf kgf  21867 9月   4 2019 NOTICE.txt
-rw-rw-r--. 1 kgf kgf   1366 9月   4 2019 README.txt
drwxr-xr-x. 3 kgf kgf   4096 9月  12 2019 sbin
drwxr-xr-x. 4 kgf kgf     31 9月  12 2019 share
[kgf@hadoop102 hadoop-3.1.3]$

2)重要目录

  • bin目录:存放对Hadoop相关服务(hdfs,yarn,mapred)进行操作的脚本
  • etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件
  • lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)
  • sbin目录:存放启动或停止Hadoop相关服务的脚本
  • share目录:存放Hadoop的依赖jar包、文档、和官方案例
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Hadoop3.1.3的完全分布式搭建主要涉及以下几个步骤:1.安装并配置Hadoop环境;2.在Hadoop集群中安装并配置NameNode和DataNode;3.配置Hadoop客户端;4.启动Hadoop集群;5.在Hadoop集群中执行MapReduce作业。 ### 回答2: Hadoop3.1.3是Apache Hadoop的一个版本,它是一个开源的分布式计算框架。要完成Hadoop3.1.3的完全分布式搭建,需进行以下几个步骤: 1. 安装Java:Hadoop是用Java编写的,因此首先要确保系统上已安装Java。可以从官方网站下载并安装Java Development Kit(JDK)。 2. 配置SSH:Hadoop需要在集群中的不同节点之间进行通信。为了实现这一点,要在所有节点上设置SSH以确保它们之间的无密码访问。可以使用ssh-keygen命令生成SSH密钥,并使用ssh-copy-id命令将公钥复制到所有节点。 3. 下载和解压缩Hadoop:从Apache官方网站下载Hadoop的最新版本(3.1.3),将其解压缩到一个合适的目录。 4. 配置Hadoop环境变量:编辑bashrc或profile文件,将Hadoop的安装路径添加到系统的环境变量中。使用命令 source ~/.bashrc 或 source ~/.profile 使其生效。 5. 配置Hadoop集群:在Hadoop的配置目录中,有一些重要的配置文件需要编辑,如core-site.xml、hdfs-site.xml和yarn-site.xml等。在core-site.xml中,设置Hadoop集群的名称、HDFS的默认文件系统和与之相关的配置。在hdfs-site.xml中,配置HDFS的相关参数,如副本数量、数据块大小等。在yarn-site.xml中,设置YARN的相关配置,如资源管理器的地址和容器的内存限制等。 6. 启动Hadoop集群:在启动集群之前,需要首先格式化NameNode,执行命令 hdfs namenode -format。然后使用命令 start-dfs.sh 启动HDFS服务,使用命令 start-yarn.sh 启动YARN服务。启动成功后,可以使用jps命令检查各个节点上的进程状态。 7. 测试Hadoop集群:在Hadoop集群正常运行后,可以使用Hadoop自带的示例程序进行测试,如使用命令 hadoop jar hadoop-mapreduce-examples.jar pi 10 100 来计算Pi的近似值。 完成上述步骤后,Hadoop3.1.3的完全分布式搭建就完成了。通过配置和启动Hadoop集群,可以实现分布式计算和存储,从而处理大规模数据集。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值