Hbase通过过滤器减少网络传输的数据,过滤器在regionserver中起作用
- 数据仍然需要从磁盘读到regionserver,因为Hbase表存储大量的数据,网络IO的节省更有意义,如果先读出所有数据传到客户端再过滤出有用数据,IO开销很大
主要有六种过滤器:比较器、列值过滤器、键值元数据过滤器、行键过滤器、功能过滤器、布隆过滤器
比较器
- 一般与其他过滤器结合使用
列值过滤器
- 列值相等、不等、范围等情况
键值元数据过滤器
行键过滤器
- 对row key进行过滤(以xxx开头、结构、包含)
功能过滤器
- 按行分页、
- 只返回每行的行间,值全部为空、
- 想只返回第一列的数据,他在找到第一列之后会停止扫描