提高HBase WAL写入性能

本文分析了HBase中WAL(Write-Ahead-Log)对系统写入性能的影响,并提出了两种解决方案:异步提交HBase-组件操作和使用Hash分区队列,以提高WAL的写入效率,降低写入延迟,从而提升整体写入性能。
摘要由CSDN通过智能技术生成

问题描述:

      HBase在集成其它组件,作为存储引擎完成组合服务时,往往是数据先写入HBase,然后对数据进行检索,之后数据通过网络传输给目标服务。HBase与组件之间的数据一致性使用WAL来保证。WAL是一种常用的保证数据可靠写入的一种技术,全称为Write-Ahead-Log,就是在向客户端返回写成功前,先将写操作在WAL中记录下来。这样即便系统在数据写入的过程中出现宕机等情况,也可以通过WAL来恢复数据。
      WAL虽然保证了数据的写入安全,但是同样引入了问题即:系统写入性能,可以看出WAL是系统写入性能的一个瓶颈。如何解决该问题以提高写入性能呢?下面是个人的两个想法,实践证明可明显提高写入性能。

问题分析与解决

       我们知道WAL是对HBase的每一次数据变更操作进行记录(只记录变更行的键值),该操作涉及到HDFS的flush操作,HDFS的flush操作会确保数据被写入对应的DataNode中,这个操作需要进行2次网络连接(第一次连接NameNode确定要写入的DataNode队列,第二次连接DataNode发送数据),比较耗时,会严重影响HBase的写入性能。

       通过分析HBase的写入过程,可以发现,HBase本身的WAL已经记录了最近写入而没有持久化的数据,只要保证HBase将数据刷入(flush)磁盘时,将HBase与其它组件的WAL写入HDFS,就可以保证HBase与组件之间的一致性。因此,可以考虑异步提交HBase-组件操作,如下所示:

  • 后台线程异步定时将WAL从内存刷入到HDFS中 ,防止日志过多;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值