大数据(Hbase)数据模型

Hbase数据模型

这里写图片描述

rowkey

Hbase是面向列式存储的分布式数据库,rowkey是行键,用来组织逻辑上的一行数据。rowkey可以是任意类型的字符串,最大长度为64KB。rowkey按照字典顺序排序存储,在设计rowkey时,需要考虑如何充分利用rowkey的这一特性,特高查询效率和存储效率,通常把经常一起读取的行存储在同一区域内。

列族

Hbase表中的每个列都属于一个列族,列族是表的schema的一部分,但列不是,列族必须在创建表时定义。列名都以列族为前缀,例如:

user:name
user:age

其中,user是列族,name 和 age 是列。

Cell

由{row key, columnFamily, version}确定的唯一单元,也就是某列的某个版本的值,Cell中的数据类有数据类型,都是以字节数组的形式存储。

Time Stamp

Hbase中通过rowkey和column family确定一个cell,这个cell包含了不同版本的数据,版本通过时间戳来表示,可以由Hbase自动生成,也可以由用户指定,自动生成时,时间戳精确到毫秒,不同版本的数据按照时间戳倒序排列。

为了避免cell版本过多,hbase提供了两种回收不同版本的cell的策略

  1. 保存数据的最后n个版本
  2. 保存数据的最后一段时间的版本
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值