HBase的数据模型

HBase的数据模型逻辑上类似关系型数据库,由行和列构成,但物理存储基于Key-Value模式。行键Row_Key是唯一的,列族是数据存储的基本单元,列可以在使用时动态增加。数据的版本通过时间戳控制,命名空间、Region、Row、Column、TimeStamp和Cell构成了HBase的数据模型。HBase架构中,Master负责表管理,Region Server处理数据操作,Zookeeper确保高可用,而HDFS提供底层存储。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        逻辑上,HBase的数据模型同关系型数据库很类似,数据也是存储在一张表中,由行和列。但HBase的底层物理存储结构是Key-Value模式。

1、HBase的逻辑结构

        Row_Key是必需有的,而且是唯一的,personal_info、office_info是列族,不同的列族是分开存储的。列族下面才是存储数据的列,而列是可以随便增加的。

        上图是HBase表的逻辑结构,实际存储中,一个表可能是放在不同的服务器节点上面。另外存储是基于HDFS集群的,所以要先了解HDFS。

2、HBase的物理存储结构

        这里需要注意,一条记录的某个字段中存储的数据,可能会有多个版本,版本是通过TimeStamp时间戳来区分控制的。例如,修改或删除数据,其实是增加一个版本,而不是删除。当查询数据时,就会通过时间戳来返回最后更改的结果。所以集群、客户端一定要注意时间同步的问题,否则可能就会出现,数据修改了或删除了,但查询数据并没有变化的情况。

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值