HBase 数据结构由RowKey、Column Family、Cell、Time Stamp、命名空间等部分组成,以下的内容对 HBase 数据结构作详细介绍。
一、RowKey
和关系型数据库一样,HBase 数据库中也有一个表示唯一的键,这个唯一的键是 RowKey,HBase 中管道 RowKey 是用来检索记录的主键,它具有唯一性。HBase 中行的访问方式如下:
- scan:全表扫描(在 HBase 学习第五天有具体描述)
- get:单个 RowKey 访问(检索单挑记录)
- like:通过 RowKey 的range(正则表达式)访问
- RowKey 组成:HBase 中 RowKey 由任意字符串组成,组成长度不超过 64KB ,在实际应用中长度一般为10-100bytes,一般用到70-100bytes就能满足需求
- 在HBASE内部,RowKey保存为字节数组。存储时,数据按照RowKey的字典序(byte order)排序存储。设计RowKey时,要充分排序存储这个特性,将经常一起读取的行存储放到一起。(位置相关性)
二、Column Family
列族: HBase 中的每个列,都属于某一个列族,列族必须在使用表之前定义,列名都以列族作为前缀,例如:‘name:zhangsan’,‘name:lisi’,其中列族是 name ,而列族