【HBase】HBase 列族属性配置

最新推荐文章于 2022-11-26 18:17:48 发布

勤言不勤语

最新推荐文章于 2022-11-26 18:17:48 发布

阅读量5k

点赞数 2

分类专栏： HBase 文章标签： HBase

本文链接：https://blog.csdn.net/w1992wishes/article/details/96156548

版权

本文详细介绍了HBase的列族属性配置，包括版本数量、存活时间、最小版本数、保留删除的单元格、数据块大小、块缓存、激进缓存、压缩、布隆过滤器、数据块编码和复制范围等关键配置。通过理解并优化这些参数，可以提升HBase的性能和数据管理效率。

摘要由CSDN通过智能技术生成

文章目录

一、创建表及属性查看

创建一个测试表 test，列族为 cf：

create 'test', {
   NAME => 'cf'}

默认属性如下：

hbase > describe 'test'

{
   
NAME => 'cf', 
BLOOMFILTER => 'ROW', 
VERSIONS => '1', 
IN_MEMORY => 'false', 
KEEP_DELETED_CELLS => 'FALSE', 
DATA_BLOCK_ENCODING => 'NONE', 
TTL => 'FOREVER', 
COMPRESSION => 'GZ', 
MIN_VERSIONS => '0', 
BLOCKCACHE => 'true',
BLOCKSIZE => '65536', 
REPLICATION_SCOPE => '0'
}

二、列族属性配置

2.1、版本数量（VERSIONS）

HBase 一切操作均为更新，Hbase Put 操作不会去覆盖一个值，只会在后面追加写，用时间戳（版本号）来区分，HBase 版本维度按递减顺序存储，以便在从存储文件读取时，首先找到最近的值；Hbase Delete 操作也不是真正删除了记录，而是放置了一个墓碑标记，过早的版本会在执行 Major Compaction 时真正删除。

0.96版本默认是3个， 0.98版本之后是1，要根据业务来划分，版本是历史记录，版本增多意味空间消耗。

插入数据的时候，版本默认是当前时间；查询的时候可以指定要获取的版本个数 get 'test', { COLUMN => 'cf', VERSIONS => 2}；

获取多个版本的时候，多个数据是按照时间戳倒序排序，也可以通过这个特性，

最低0.47元/天解锁文章

勤言不勤语

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
【HBase】HBase 列族属性配置

文章目录一、创建表及属性查看二、列族属性配置2.1、版本数量（VERSIONS）2.2、存活时间（TTL）2.3、最小版本数（MIN_VERSIONS ）2.4、保留删除的单元格（KEEP_DELETED_CELLS）2.5、数据块大小（BLOCKSIZE ）2.6、块缓存（BLOCKCACHE）2.7、激进缓存（IN_MEMORY）2.8、压缩（COMPRESSION）2.9、布隆过滤器（BLO...
复制链接

扫一扫

专栏目录