完全分布式
Hadoop 运行模式包括:本地模式、伪分布式模式以及完全分布式模式。
本地模式:单机运行,只是用来演示一下官方案例。生产环境不用。
伪分布式模式:也是单机运行,但是具备 Hadoop 集群的所有功能,一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。
完全分布式模式:多台服务器组成分布式环境。生产环境使用。
*完全分布式一般要扩展为HA完全分布式
虚拟机网络配置
配置虚拟机的NAT模式
在vm的编辑中找到虚拟网络编辑器,确定vmnet8的网络模式为NAT模式;设置一个子网,例如192.168.100.0
windows的网络适配器中的vmnet8的ipv4中的IP地址为虚拟机中配置的地址,例如虚拟机网络编辑器中配置了192.168.100.0,ipv4中要配置192.168.100.1
常用工具安装
打开虚拟机,使用命令:
yum install -y epel-release 第三方rpm源,比官方的更丰富版本更新
最小化安装的Linux,需要安装以下工具:
yum install -y vim 安装vim
yum install -y net-tools 安装工具包集合,内置了多种命令
防火墙处理
关闭防火墙
systemctl stop firewalld
防火墙一定是开启的,直接关闭,没有必要使用systemctl status firewalld查看状态,再决定关闭。
关闭防火墙自启动
systemctl disable firewalld.service
不关闭自启动下次开机防火墙还会启动
为什么要关闭防火墙
开启防火墙的话,机器之间的通信会受到限制和影响;局域网内部的防火墙关闭并不会有安全威胁,因为对外网还有一个防火墙。
修改必要文件
修改如下文件:(使用vi或vim)
/etc/hostname 主机名 显示给自己看的名字
/etc/hosts IP地址映射 访问其他主机可以使用别称
/etc/sysconfig/network-scripts/ifcfg-ens33 网络配置 机器的ip地址,配置成功可以与外部通信
BOOTPROTO 修改为 static 静态IP
ONBOOT 改为yes 激活网卡,可成功连接网络
IPADDR IP地址
GATEWAY 网关
DNS1 DNS
重启机器(reboot),使机器名生效,并达到重启网络服务的目的(否则要使用systemctl restart network.service重启网络服务)