题目:使用Hadoop、Hbase搭建新能源汽车大数据平台。
前期工作:先进行Hadoop集群的搭建
1、安装VMware Workstation 16 PRO
2、基于VMware Workstation 16 PRO安装Centos7
3、准备三台虚拟机,进行完全分布式安装,修改相关配置项
目录
4、NameNode要高可用,即运行两个NameNode进程,同一时刻只有一个对外提供服务的NameNode,如果活跃的NameNode进程所在机器宕机了,整个集群还是可以正常运行的;
6、Hbase要集群部署,可正常建表、插入数据和查询数据等;
实现前期配置:
记得下载镜像文件!!
前期配置参照老师的PPT教程,详见课件。
第一部分:实现集群的三个节点
先设置伪分布式,在进行完全分布式的配置
想要在机器1上,远程控制机器2,常用的方案就是在机器1安装ssh客户端,机器2安装ssh服务端,ssh客户端和ssh服务端之间的通信协议是ssh协议。
设置SSH免密登录,通过用户名、密码的方式远程登录。
在linux系统中ssh命令,就是一个ssh客户端程序,sshd服务,就是一个ssh服务端程序。在windows中,给大家提供的mobaxterm是一个图形化界面的ssh客户端。
接下来进行完全分布式的配置,Hadoop都是采用完全分布式安装,也就是集群部署。在这种模式下,Hadoop是运行在多个主机/节点上的。一般来说,集群部署至少需要三台主机。
之前我们用vmware workstation 15 player创建了一