HBase安装与基本应用

HBase简介

HBase一Hadoop Database,是-一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer.上搭建起大规模结构化存储集群。HBase利用HadoopHDFS作为其文件存储系统,利用HadoopMapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。

•HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。

数据模型

1)Name Space 命名空间,类似于关系型数据库的 DatabBase 概念,每个命名空间下有多个表。HBase 有两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表, default 表是用户默认使用的命名空间。

2)Region 类似于关系型数据库的表概念。不同的是,HBase 定义表时只需要声明列族即可,不需 要声明具体的列。这意味着,往 HBase 写入数据时,字段可以动态、按需指定。因此,和关 系型数据库相比,HBase 能够轻松应对字段变更的场景。

3)Row HBase 表中的每行数据都由一个 RowKey 和多个 Column(列)组成,数据是按照 RowKey 的字典顺序存储的,并且查询数据时只能根据 RowKey 进行检索,所以 RowKey 的设计十分重 要。

4)Column HBase 中的每个列都由 Column Family(列族)和 Column Qualifier(列限定符)进行限 定,例如 info:name,info:age。建表时,只需指明列族,而列限定符无需预先定义。

5)Time Stamp 用于标识数据的不同版本(version),每条数据写入时,如果不指定时间戳,系统会 自动为其加上该字段,其值为写入 HBase 的时间。

6)Cell 由{rowkey, column Family:column Qualifier, time Stamp} 唯一确定的单元。cell 中的数 据是没有类型的,全部是字节码形式存贮。

HBase 基本架构

在这里插入图片描述
架构角色:

1)Region Server Region Server 为 Region 的管理者,其实现类为 HRegionServer,主要作用如下: 对于数据的操作:get, put, delete; 对于 Region 的操作:splitRegion、compactRegion。

2)Master Master 是所有 Region Server 的管理者,其实现类为 HMaster,主要作用如下: 对于表的操作:create, delete, alter 对于 RegionServer的操作:分配 regions到每个RegionServer,监控每个 RegionServer 的状态,负载均衡和故障转移。

3)Zookeeper HBase 通过 Zookeeper 来做 Master 的高可用、RegionServer 的监控、元数据的入口以及 集群配置的维护等工作。

对于 HBase 而言,Zookeeper的作用是至关重要的。首先Zookeeper是作为HBase Master的HA解决方案。也就是说,是Zookeeper保证了至少有一个HBase Master 处于运行状态。并且Zookeeper负责Region和Region Server的注册。其实Zookeeper发展到目前为止,已经成为了分布式大数据框架中容错性的标准框架。不光是HBase,几乎所有的分布式大数据相关的开源框架,都依赖于Zookeeper实现HA。

4)HDFS HDFS 为 HBase 提供最终的底层数据存储服务,同时为 HBase 提供高可用的支持。 尚硅谷大数据技术

安装HBase

先安装Zookeeper,hadoop,spark
zookeeper,hadoop安装链接
hadoop安装链接
1、从清华大小镜像站点下载HBbase

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hbase/stable/hbase-2.2.4-bin.tar.gz

2、解压程序包,并改名 放在/usr目录下

tar xzvf hbase-2.2.4-bin.tar.gz 
mv  hbase-2.2.4 hbase
mv  hbase /usr

3、配置环境变量,在/etc/proflie中将hbase下的bin目录添加到path中

vi /etc/profile
添加:
export HBASE_CLASSPATH=/usr/hbase/conf
export PATH=$PATH:/usr/hbase/bin
重启:
source /ect/profile

在这里插入图片描述
4、查看Hbase的版本

hbase version

在这里插入图片描述

配置HBase数据存储于hadoop

1.在hbase-env.sh配置JAVA_HOME和HADOOP_HOME环境变量

cd /usr/hbase/conf
vi hbase-env.sh
添加:
export JAVA_HOME=/usr/java/jdk
export HADOOP_HOME=/usr/hadoop
按esc :x 保存退出

在这里插入图片描述

2、配置hbase-site.xml文件

vi hbase-site.xml 
添加:
<property>
    <name>hbase.rootdir</name>
    <value>hdfs://192.168.100.101:8020/hbase/hbase_db</value>
</property>
<property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
</property>
<property>
    <name>hbase.zookeeper.quorum</name>
    <value>master,slave1,slave2</value>
</property>
<property>
 <name>hbase.zookeeper.property.dataDir</name>
 <value>/usr/hbase/zookeeper</value>
</property>
<property>
<name>hbase.master.info.port</name>
<value>16610</value>
</property>
<property>
     <name>zookeeper.znode.parent</name>
     <value>/hbase/master</value>
 </property>

在这里插入图片描述

3、配置regionservers

 vi regionservers
 添加:
 master
slave1
slave2

在这里插入图片描述

4、拷贝Hbase和/etc/profile到slave1和 slave2

scp -r /usr/hbase/ slave1:/usr
scp -r /usr/hbase/ slave2:/usr
scp -r /etc/profile slave1:/etc/profile
scp -r /etc/profile slave2:/etc/profile

5、开启hadoop,spark

 cd /usr/hadoop
 ./sbin/start-all.sh
 cd /usr/spark/spark-2.4.5-bin-hadoop2.6/
 ./sbin/start-all.sh

在这里插入图片描述
在这里插入图片描述

6、启动HBase集群

./bin/start-hbase.sh 

在这里插入图片描述

7、打开master:16610查看启动的情况
在这里插入图片描述

8、启动HBase客户端

bin/hbase shell

在这里插入图片描述

如果输入list 久久没有反应卡住就证明有问题

HBase Shell 操作
名称命令表示式
创建表create ‘表名称’, ‘列族名称1’,‘列族名称2’,‘列族名称N’
添加记录put ‘表名称’, ‘行名称’, ‘列名称:’, ‘值’
查看记录get ‘表名称’, ‘行名称’
查看表中的记录总数count ‘表名称’
删除记录delete ‘表名’ ,‘行名称’ , ‘列名称’
删除一张表先要屏蔽该表,才能对该表进行删除,第一步 disable ‘表名称’ 第二步 drop ‘表名称’
查看所有记录scan “表名称”
查看某个表某个列中所有数据scan “表名称” , {COLUMNS=>‘列族名称:列名称’}
更新记录就是重写一遍进行覆盖,跟添加记录一样
1、基本操作

1)进入HBase客户端

cd /usr/hbase
bin/hbase shell

在这里插入图片描述

2)查看帮助命令

hbase(main):001:0> help

3)查看当前数据库表

hbase(main):002:0> list
2、表操作

1)创建表

hbase(main):008:0> create 'student','info'

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xPrStVKD-1591921512982)(F:\csdn\hbase1.assets\image-20200610152944725.png)]

2)插入数据到表

put ’<table name>’,’row1’,’<colfamily:colname>’,’<value>’
hbase(main):010:0>  put 'student','1001','info:sex','male'               hbase(main):011:0> put 'student','1001','info:age','18'    
hbase(main):012:0> put 'student','1002','info:name','Janna'
hbase(main):013:0>  put 'student','1002','info:sex','female'              hbase(main):014:0>  put 'student','1002','info:age','20'  

在这里插入图片描述

3)扫描查看表数据

全部查看

hbase(main):015:0> scan 'student'

在这里插入图片描述

查看以1001开始,以1001结束

hbase(main):016:0> scan 'student',{STARTROW=>'1001',STOPROW=>'1001'}

在这里插入图片描述
查看以1002开始

hbase(main):018:0>  scan 'student',{STARTROW => '1002'}

在这里插入图片描述
4)查看表结构

hbase(main):021:0> describe 'student'

在这里插入图片描述

5)更新指定字段的数据

put ‘table name’,’row ’,'Column family:column name',’new value’
hbase(main):023:0>  put 'student','1001','info:name','Nick'                                                      
hbase(main):024:0>  put 'student','1001','info:age','100'

在这里插入图片描述

6)获取“指定行”或“指定列族:列”的数据

get ’<table name>’,’row1’
get 'table name', ‘rowid’, {COLUMN => ‘column family:column name ’}
hbase(main):026:0> get 'student','1001'
hbase(main):027:0> get 'student','1001','info:name'

在这里插入图片描述

7)统计表数据行数

hbase(main):028:0> count 'student'

在这里插入图片描述
8)删除数据

删除某 rowkey 的全部数据:

 hbase(main):032:0> deleteall 'student','1001'

在这里插入图片描述

删除某 rowkey 的某一列数据:

hbase(main):002:0> delete 'student','1002','info:sex'

在这里插入图片描述

9)清空表数据

hbase(main):005:0> truncate 'student'

提示:清空表的操作顺序为先 disable,然后再 truncate。
在这里插入图片描述

10)删除表

首先需要先让该表为 disable 状态:

hbase(main):008:0> disable 'student'

然后才能 drop 这个表:

hbase(main):009:0> drop 'student'

提示:如果直接 drop 表,会报错:ERROR: Table student is enabled. Disable it first.
在这里插入图片描述

11)查看,变更表信息 将 info 列族中的数据存放 3 个版本:

hbase(main):017:0> describe 'student'
hbase(main):018:0> alter 'student',{NAME=>'info',VERSIONS=>3}
hbase(main):022:0> get 'student','1001'{COLUMN=>'info:name',VERSIONS=>3}

VERSIONS => 3是指此单元格内的数据可以保留最近的 3 个版本

在这里插入图片描述在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值