HBASE的特性:
hbase是一个分布式数据库系统,数据增删改查功能模块是分布式系统;
hbase的数据最终持久化存储是基于HDFS的,存储容量可以随时在线扩容;
是非关系型数据库(nosql)。
HBASE的表结构:
每个表有一个表名。
表中有行键(rowkey),列族(base_info,extra_info)。
一个表可以分为多个列族,不同列族的数据存储在不同的文件中
表中每一行有一个行键,且行键在表中不能重复
行键和列族可以确定多个键值对,每个键值对为一个cell(单元)。
每个cell中key可以存储多个value版本,调用时默认调用最新版本,hbase中的数据不能修改,只能添加或删除。
整张表由于数据量过大,会被横向切成若干个region,用rowkey范围标识,不同regioin的数据会存储在不同的文件中
HBASE数据存储顺序:
插入到hbase中去的数据,hbase会自动排序存储
首先按rowkey排序
同一行里的kv按照列族排序
最后按照k排序
HBASE表中存储的数据类型:
hbase中只支持字节型数组byte[],byte[]包括rowkey,key,value,列族名,表名
HBASE 命令行客