hadoop完全分布式安装
- 一、HADOOP完全分布式安装
-
-
- 1.先配好一台伪分布虚拟机(免密不成功请看最后补充说明)
- 2.把配置好的虚拟机复制三个虚拟机
- 3.为了避免混乱以其中一台机子为例子,右键更改名字为master.其他两台同理(过程省略)
- 4.配置虚拟机静态ip(此时三台虚拟机的静态ip都相同)
- 5、修改三台虚拟机(master、save1、save2)的ip和网关。三台机子ip不能一样(以master为例子,其他同理)
- 6、修改当前主机名字(以master为例子,其他同理),修改完重新打开
- 7、增加三条映射记录
- 8.master的hosts映射配置好后,通过scp命令同步到save1、save2.的etc路径下(默认覆盖原有文件)
- 9、同步完文件分别查看master、save1、save2是否有三条映射,有的话说明同步成功。
- 10、尝试ping三台主机,以下是成功运行的截图(master为例)ctrl+c停止运行
- 11、设置免密登录(这一步应该在伪分布式的时候做好)
- 12、关闭防火墙(以master为例)
- 13、删除伪分布式数据master、save1、save2,路径为/usr/local/hadoop-2.7.1/data,保持环境干净删除data整个文件,我这边手动删除
- 14、vi修改master上伪分布式文件(master为例)
- 15、使用scp同步save1、save2
- 16.同步时间三台虚拟机
- 17、格式化hdfs namenode -format
- 18.启动start-all.sh(反面教材,免密应该在伪分布式就弄了,我后面才发现弄免密没弄成功),每运行一个进程就要输入一个密码不然就会卡住不动
- 19.查看hdfs的web管理页面访问master的50070端口:http://192.168.91.4:50070
- 20. 查看yarn的web管理页面192.168.91.4:8088
- 免密登录补充说明:
-
题目: 使用Hadoop、Hbase搭建新能源汽车大数据平台。
要求:1、集群至少要有三个节点;
2、由于条件有限,所以要求集群至少可以存储100G的数据;
3、将HDFS副本数设置为3;
4、NameNode要高可用,即运行两个NameNode进程,同一时刻只有一个对外提供服务的NameNode,如果活跃的NameNode进程所在机器宕机了,整个集群还是可以正常运行的;
5、可以正常提交MapReduce运行;
6、Hbase要集群部署,可正常建表、插入数据和查询数据等;
7、部署一个Mysql数据库,要求可以远程访问。
一、HADOOP完全分布式安装
1.先配好一台伪分布虚拟机(免密不成功请看最后补充说明)
2.把配置好的虚拟机复制三个虚拟机
(1)找到配置好虚拟机的路径
(2)在新路径新建三个文件夹分别是(注意此时文件为空),之后把上一步里面配好的虚拟机文件全部复制过来放到三个不同的文件
3.为了避免混乱以其中一台机子为例子,右键更改名字为master.其他两台同理(过程省略)
这个是最后改好的样子
4.配置虚拟机静态ip(此时三台虚拟机的静态ip都相同)
(1)查看自己的主机静态ip,打开cmd/命令提示符/win+r
(2)输入ipconfig,看到VMent8就是我们要的ip
5、修改三台虚拟机(master、save1、save2)的ip和网关。三台机子ip不能一样(以master为例子,其他同理)
命令为
vi /etc/sysconfig/network-scripts/ifcfg-ens33
可以修改192.168.53.3~192.168.159.254 任意一个ip
192.168.91.3改为192.168.91.4
依次修改save1、save2
ip修改后重启网卡
systemctl restart network
注意修改完重启客户机三台,不然用MobaXterm连接不上
(1)打开MobaXterm尝试连接以上三台虚拟机。
<