一、实验目的:
掌握分布式数据库环境的搭建,从实践环境搭建的过程中,初步理解分布式数据库的含义。
二、实验内容:
以HBase分布式数据库为例,掌握分布式数据库环境的基本搭建步骤,包括单机模式、伪分布模式和完全分布模式。能够通过环境平台的搭建,熟悉分布式数据库的有关技术体系架构。
实验重点:HBase环境的搭建
实验难点:以完全分布式为例,前期Hadoop集群和Zookeeper的安装,以及网络通信的测试。
三、实验结果:
搭建HBase完全分布式集群环境:
1、创建虚拟机
①创建虚拟机CentOS7Server,通过CentOS7Server克隆三台新的虚拟机,分别命名为hadp01、hadp02、hadp03。
②编辑Windows系统的hosts文件
2、设置网卡静态IP
①查看本机网卡
②编辑网卡文件
③重启网卡使设置生效,分别在hadp01-03检查网络是否连通
3.配置虚拟机主机名
通过MobaXter连接虚拟机hadp01-03,后续所有操作都通过MobaXterm进行完成。
①在虚拟机hadp01上编辑hostname文件,修改文件内容为:hadp01
②hadp02的hostname文件内容改为:hadp02
③hadp03的hostname文件内容改为:hadp03
④分别编辑三台虚拟机hadp01-03的hosts文件
4、安装JDK
①编辑/etc/profile文件,在文件的末尾设置JAVA环境变量
②安装完后,查看三台虚拟机上的jdk版本信息
5、安装Hadoop2.9.2
①安装完成后,启动hadoop集群
②在Windows中启动浏览器查看运行情况
HDFS的Web页面:hadp01:50070
YARN的Web页面:hadp01:8088
6、安装Zookeeper-3.5.6
①安装完成后,启动服务端
②查看是否有无服务
③启动客户端
④输入ls / 显示zookeeper
7、安装HBase2.2.6
①安装完成后,启动HBase
②分别查看三台虚拟机的进程
③Hbase的Web页面:hadp01:16010
8、问题:HBase不同节点之间是怎么进行通信的?
HBase采用了和Hadoop相同的RPC机制,作为它的主要通信手段,这是一个轻量的,不同于Java标准的RMI的一种方式。分布式系统使处于不同物理位置的多个进程组成的整体,为了确保整体有效并且高效的对外提供服务,每个节点都需要进行通信来交换信息。RPC是将单机环境下的过程调用加以扩充后延伸到分布式系统环境。
HBase依赖于Zookeeper提供消息通信机制。HMaster启动时,会向Zookeeper申请一个临时节点并添加监听;RegionServer启动时,也会注册一个临时节点,HMaster会监控所有RegionServer的临时节点; RegionServer启动时会发送RPC请求到HMaster,报告当前启动的时间、状态、hostname等信息。
所以最基本的工作流程就是:客户端取得一个服务端通信接口的实例;客户端调用这个实例中的方法;客户端向服务端传输调用请求;服务端接口实现被调用;服务端向客户端传输结果。
四、实验总结:
此处实验我完成了。。。。。。