HBase1.2.3版本表属性介绍

最新推荐文章于 2024-08-04 03:29:28 发布

农村外出务工男

最新推荐文章于 2024-08-04 03:29:28 发布

阅读量702

点赞数

分类专栏： hbase HBase1.2.3版本相关源码分析文章标签： HBase表属性

本文链接：https://blog.csdn.net/charry_a/article/details/79146552

版权

hbase 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

HBase1.2.3版本相关源码分析

9 篇文章 4 订阅

订阅专栏

一、查看表

二、属性介绍

2.1 BLOOMFILTER

布隆过滤器，可选值NONE|ROW|ROWCOL，默认为NONE，该参数可以单独对某个列簇启用。对于get操作以及部分scan操作可以剔除掉不会用到的存储文件，减少实际IO次数，提高随机读性能。Row类型适用于只根据Row进行查找，而RowCol类型适用于根据Row+Col联合查找，如下：

Row类型适用于：get ‘NewsClickFeedback’,’row1′

RowCol类型适用于：get ‘NewsClickFeedback’,’row1′,{COLUMN => ‘Toutiao’}

对于有随机读的业务，建议开启Row类型的过滤器，使用空间换时间，提高随机读性能。具体blommfilter的原理可参加这篇http://blog.csdn.net/hguisu/article/details/7866173

2.2 VERSIONS/MIN_VERSION

Hbase的数据存储有多版本的概念，默认数据的版本为1，每次更新数据的时候，会根据不同的时间戳保存不同的版本数据，如果想保存多份数据，可将最大版本数设置大于1。

2.3 IN_MEMORY

Blockcache读缓存会分几个层级，第一级就是IN_MEMORY级缓存，表示常驻内存，一般情况下元数据信息会放在IN_MEMORY级，而不要将大数据量设置为常驻内存，这样会将meta元数据信息给置换出去。

2.4 KEEP_DELETED_CELLS

HBase允许进行基于时间的查询从而得到指定时间段的历史数据。查询时间T的数据即查询[0,T+1)的数据。这样就带来了一个潜在的问题。当一个 delete marker被set上，所有被它影响到的数据都不再可见。如果你在时间T put了一个qualifier为C的数据，接着在T+X的时间点删除这个qualifier，此时查询[0,T+1)时间段的数据将不会返回 qualifier为C的这个KV对，而假如KEEP_DELETED_CELLS = true的话，被删除的数据在基于时间的历史数据查询中依然可见。