《HBase权威指南》读书笔记9:第九章 高级用法

行键设计

高表与宽表

  • 高表:表中列少行多
  • 宽表:表中列多行少
Hbase只能按行分片,因此高表更有优势。
把需要检索的条件尽量放到行键rowkey里面去
宽表适合需要行级原子性的需求

辅助索引

  • 由客户端管理索引:缺点比优点更多
  • 带索引的事务型Hbase: ITHbase  (个人认为要远离在原本就不成熟的HBase上的更不成熟的封装)
  • 带索引的Hbase: IHbase (个人认为要远离在原本就不成熟的HBase上的更不成熟的封装)
  • 协处理器: 用钩子维护索引

搜索集成

  • 用HBase存储数据,用MapReduce任务建立索引,索引使用Lucene 或者 Solr。并且Lucene的后台存储用HBase
  • BuildTableIndex类可以扫描整个表,并建立Lucene索引,存储在HDFS上
  • HBasene: 直接在HBase内部建立搜索索引

布隆过滤器

布隆过滤器可以减少 I/O操作的层面,但是消耗很大的性能,默认不要用


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值