文章目录
前言
HBase 是一个面向列式存储的分布式数据库,HBase 底层存储基于 HDFS 实现,集群的管理基于 ZooKeeper 实现。
一、HBase部署与启动
1.下载、解压缩安装包
2.在/etc/profile全局配置文件中添加
export HBASE_HOME=/export/servers/hbase-2.4.5
export PATH=$PATH:$HBASE_HOME/bin
HBASE_HOME按照自己路径配置
3.配置hbase-env.sh
export JAVA_HOME=/export/servers/jdk1.8.0_161
export HBASE_MANAGES_ZK=false # 使用外部的ZooKeeper
4.配置hbase-site.xml
<configuration>
<!-- hbase数据存放的目录,若用本地目录,必须带上file://,否则hbase启动不起来 -->
<property>
<name>hbase.rootdir</name>
<value>hdfs://my2308-host:9000/hbase</value>
</property>
<!-- zk的位置 -->
<property>
<name>hbase.zookeeper.quorum</name>
<value>localhost</value>
<description>my2308-host:2181</description>
</property>
<!--hbase.cluster.distributed表示是否分布式部署,指定为true-->
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<!-- hbase主节点的位置 -->
<property>
<name>hbase.master</name>
<value>my2308-host:60000</value>
</property>
</configuration>
5.拷贝zookeeper的conf/zoo.cfg到hbase的conf/下
6.启动HBase
应先启动Hadoop集群和ZooKeeper服务
在HBase的bin目录下:
start-hbase.sh
二、HBase基本操作
1.数据库操作演示:
- 进入 hbase 客户端
hbase shell
- 查看所有库(命名空间)
list_namespace
- 创建一个名称为’mydb’的库
create_namespace 'mydb'
- 删除’mydb’库
drop_namespace 'mydb'
2.表操作演示
- 查看 'mydb’库下的表
list_namespace_tables 'mydb'
- 查看所有自己创建的表
list
- 在’mydb’库下创建名为test的表,并创建’f1’、'f2’两个列族
create 'mydb:test','f1','f2'
注意:创建表时若不指定库名,则默认在default库下创建表,创建表需要至少指定一个列族
- 查看表详细信息
describe 'mydb:test'
或
desc 'mydb:test'
- 增加列族
alter 'mydb:test','f3'
- 删除列族
alter 'mydb:test','delete'=>'f2'
- 删除表
disable 'mydb:test'
drop 'mydb:test'
注意:删除表需要先进行disable,再进行drop
3.数据的CRUD操作
- 先在 default 库下创建一个名为stu的表,列族名称是 info
create 'stu','info'
- 插入数据
put 'stu','1001','info:name','linghc'
put 'stu','1001','info:sex','man'
put 'stu','1001','info:age','26'
put 'stu','1002','info:name','renyy'
put 'stu','1002','info:sex','female'
put 'stu','1002','info:age','24'
put 'stu','1003','info:name','yilin'
put 'stu','1003','info:sex','female'
put 'stu','1003','info:age','18'
# 某一行的列的个数可以不一样
put 'stu','1004','info:name','dongfangb'
put 'stu','1004','info:sex','female'
put 'stu','1004','info:age','28'
put 'stu','1004','info:party','rysj'
- 根据row key(行键)查询
get 'stu','1004'
- 根据行键、列名查询
get 'stu','1004','info:name','info:age'
- 扫描表数据
scan 'stu'
- 按rowkey范围扫描 {STARTROW => ‘1001’ ,STOPROW => ‘1003’} :左闭右开,此时只查询到 1002
scan 'stu',{STARTROW => '1001' ,STOPROW => '1003'}
- 指定STOPROW 后加!,可以实现左闭右闭
scan 'stu',{STARTROW => '1001' ,STOPROW => '1003!'}
- 修改数据:直接put进行覆盖
put 'stu','1001','info:name','linghc1'
注意:修改数据后,其实只是在原来的基础上增加了一条数据,查询的时候返回了时间戳最新的一个版本,旧版本的数据还在;
- 查寻每个单元格的2个版本数据
scan 'stu',{RAW=>true,VERSIONS=>2}
注意RAW参数必须和VERSIONS一起使用
旧版本的数据在适当的时候会被释放;如果想要保留最新两个版本的数据,可以将某个表的 VERSIONS设置为2。
- 更改表的VERSIONS
alter 'stu',{NAME=>'info',VERSIONS=>2}
- 删除数据
delete 'stu','1001','info:sex'
此时查询会发现无数据
get 'stu','1001','info:sex'
再通过版本号查询
scan 'stu',{RAW=>true,VERSIONS=>2}
会发现删除的数据有Delete标注
- 根据行键和列名删除列
deleteall 'stu','1001','info:sex'
标注为:DeleteColumn
- 根据行键删除列族
deleteall 'stu','1004'
标注为:DeleteFamily
- 删除表中所有数据
truncate 'stu'
truncate命令将删除表中的所有数据行,但是保留表的结构和配置信息。