HBase到底是列式存储还是行式存储?

行存和列存

在行存储的数据库系统中,一行中的所有字段值都是连续存储的;在基于行存储的表中,即使只需要读取指定列时,也需要先将对应行的数据读取到内存,再过滤目标列,这样会导致过多的磁盘IO、内存和时间开销,所以行式存储比较适用于每次需要访问完整行的场景。

基于列的存储,是将列数据连续存储在一起。因为是将相同类型的数据存储在了一起,
列存储通常能提供更好的压缩率,因为同一列的数据类型相同,数据特征更加相似。
加速查询性能,特别对于只需要少量列的分析计算(如SUM、AVG、MIN、MAX)在列存储中非常高效。

选择行存储还是列存储通常取决于应用的特定需求。如果应用需要频繁执行事务性操作,如增加、更新、删除记录,那么行存储数据库可能是更好的选择。如果应用主要进行读操作,尤其是大规模数据分析和报告,其中聚合和只读取部分列是常态,那么列存储数据库可能更适合。

HBase

HBase表数据模型比较特别可以简单理解为有行和列的二维表,只是它的列称为“列族”,列族下面又可以在数据写入时指定很多的子列。另外,HBase物理存储上是将整个列族数据存储在一起的。所以,如果HBase中的一张表只有一个列族的话,等于是这个列族包含了这张表的所有列,也就是将表正行的数据连续存储在了一起,就等于是行式存储了。再比如,一张表有多个列族,并且每个列族下仅有一列(虽然HBase不建议这么做),也就是将表的列数据连续存储在了一起,就等于是列式存储了。

总而言之,HBase具有列族的特性,它的物理存储可视为按列族组织的,但从逻辑层面和数据访问模式来看,它同时体现了按行存储的特点。因此,将HBase定性为纯粹的列式存储系统或行式存储系统都不够准确,它更应被看作是一种结合了列族和行存储优点的特殊数据库系统。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值