hbase 导入到es_Elasticsearch 集成hbase实现

本文介绍了如何使用HBase的Observer协处理器实现数据从HBase到Elasticsearch的实时同步,包括Observer的工作原理、应用场景、Java实现、部署方式,以及与HBase集成的其他准实时同步数据方法。通过Observer,可以在数据写入HBase的同时更新Elasticsearch索引,以提高检索性能。
摘要由CSDN通过智能技术生成

一、HBase概述是一个分布式nosql的非关系数据库.

基于HDFS适合海量数据存储

根据RowKey查询数据,效率高

模糊查询效率非常差

随意组合的多条件查询非常差

1.Hbase Observer

HBase 0.92版本后推出了Coprocessor -- 协处理器,一个工作在Master/RegionServer中的框架,能运行用户的代码,从而灵活地完成分布式数据处理的任务。

Coprocessor包含两个组件,一个是EndPoint(类似关系型数据库的存储过程),用以加快特定查询的响应,另一个就是Observer(类似关系型数据库的触发器)。Observer也分为几个类型,其中RegionObserver提供了一组表数据操作的钩子函数,覆盖了Get、Put、Scan、Delete等操作(通常有pre和post两种情况,表示在操作发生之前或发生之后),我们可以通过重载这些钩子函数,利用RegionServer实现特定的数据处理需求。

基于RegionObserver的钩子函数,我们可以覆盖Put及Delete方法来实现Hbase和ES直接的数据同步。

2. 方案目标实现对HBase高性能的范围检索

保证数据的低冗余

保持数据的一致性

3.方案流程

数据进入HBase时,利用Observer同步进入ES索引库;

客户端根据查询条件,利用ES提供的Java API对ES发起查询请求;

ES返回符合条件的RowKey;

客户端再根据RowKey去HBase获取数据;

最后HB

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值