前言
Hadoop是一个适合大数据的分布式存储和计算平台。狭义上说Hadoop就是一个框架平台,广义上讲Hadoop代表大数据的一个技术生态圈,包括很多软件框架。而我们的完全分布式,指的是在真实环境下,使⽤多台机器,共同配合,来构建⼀个完整的分布式文件系统。在真实环境中,hdfs中的相关守护进程也会分布在不同的机器中。
一、部署需要的软件
- 虚拟机管理软件:VMware
- 系统:CentOS 7 64 位
- SSH⼯具:MobaXterm
- JDK:jdk-8u221-linux-x64.tar.gz
- Hadoop:hadoop-2.7.1
主机名 | IP地址 |
---|---|
master | 192.168.206.18 |
slave1 | 192.168.206.28 |
slave2 | 192.168.206.38 |
首先要确保本地电脑是否已经安装好了VMware Workstation Pro
下载地址: VMware Workstation Pro | CN
清华大学镜像源:
Index of /centos/7/isos/x86_64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
注意!注意!注意!
如果虚拟机是从伪分布式复制过来的,最好先把伪分布式的相关守护进程关闭:stop-all.sh,并且保留好自己的伪分布式部署。
二、Hadoop配置环境
我们设置ip地址首先【Win+R——cmd】使用ipconfig的命令查看VMnet8的ip地址是多少。
例如我的ip地址为192.168.206.1,那么我hadoop的ip地址前3位就需要设置为192.168.206,然后进入到我们的虚拟机里面进行ip地址的设置。
1. 配置网络环境
输入命令vi /etc/sysconfig/network-scripts/ifcfg-ens33进行静态ip地址的设置。
BOOTPROTO=static
ONBOOT=yes
IPADDR=静态ip(这个ip与你的主机在同一个网段)
GATEWAY=网关
NETMASK=子网掩码
DNS1=8.8.8.8