【HBase + ElasticSearch最佳实践】

本文介绍了在大数据场景下,如何结合HBase和ElasticSearch构建存储搜索解决方案。探讨了HBase的查询方式、需求分析以及两种数据同步方案:独立写入和HBase协处理监听。同时,指出了方案的优缺点和潜在问题,为实际操作提供了指导。
摘要由CSDN通过智能技术生成

序言

最近项目组要为客户提供一个基于HBase和ElasticSearch的大数据存储搜索解决方案,提供HBase + ElasticSearch的标准解决方案样例,包括数据写入以及查询。以下简称ES。

需求分析

HBase的查询实现只提供两种方式:
1、按指定RowKey获取唯一一条记录,get方法(org.apache.hadoop.hbase.client.Get)
2、按指定的条件获取一批记录,scan方法(org.apache.hadoop.hbase.client.Scan)
用好HBase的第一步是要将rowkey设计好。大数据量查询最好从rowkey入手,ColumnValueFilter的速度是很慢的,HBase查询速度还是要依靠rowkey,所以根据业务逻辑把rowkey设计好,之后所有的查询都通过rowkey,是会非常快。 批量查询最好是用 scan的startkey endkey来做查询条件。
HBase在0.92之后引入了coprocessors,提供了一系列的钩子,让我们能够轻易实现访问控制和二级索引的特性。
当前平台内没有对HBase + ES的解决方案,需要给出一个能够指导用户使用HBase和ES组件的解决方案。
目前可能的需求场景如下:

  1. 批量索引:HBase上已有大量数据,需要在ES上建立索引;
  2. 增量索引:HBase上已有大量数据,提供HBase的rowkey,实现对ES的增量索引;
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值