HBase 在分布式模式下的配置
前言
HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是谷歌BigTable的开源实现,主要用来存储非结构化和半结构化的松散数据。HBase的目标是处理非常庞大的表,可以通过水平扩展的方式,利用廉价的计算机集群处理由超过10个亿行数据和数百万列元素组成的数据表。
一、环境
介绍HBase的安装方法,并介绍HBase在分布式模式下的配置。需要以下环境:VirtualBox 6.1.14, Ubuntu 16.04。
二、配置步骤
1.安装HBase
HBase是Hadoop生态系统中的一个组件,但是,Hadoop安装以后,本身并不包含HBase,因此,需要单独安装HBase。
打开网页:https://dblab.xmu.edu.cn/post/bigdatapractice2/
找到下载专区,下载HBase安装文件hbase-1.1.5-bin.tar.gz。再通过WinSCP软件上传到Linux系统的"/home/hadoop/下载"目录下。
打开一个终端,执行如下命令对文件进行解压:
sudo tar -zxf ~/下载/hbase-1.1.5-bin.tar.gz -C /usr/local
将解压的文件名hbase-1.1.5改为hbase以方便使用,命令如下:
sudo mv /usr/local/hbase-1.1.5 /usr/local/hbase
将HBase安装目录下的bin目录添加到系统的PATH环境变量中,这样每次启动HBase就不需要到/usr/local/hbase目录下执行启动命令,方便HBase的使用。使用vim编辑器打开~/.bashrc文件,命令如下:
vim ~/.bashrc
打开bashrc文件后,把HBase的bin目录/usr/local/hbase/bin加到PATH中,新加结果如下:
export PATH