flume 采集写入hbase速度越来越慢_flume 进阶 0338

本文详细介绍了Flume的事务处理,包括Put和Take事务流程,探讨了Flume Agent内部的重要组件如Channel Selector和Sink Processor的工作原理。此外,还讨论了Flume拓扑结构中的简单串联、复制与多路复用、负载均衡和故障转移以及聚合策略,特别是如何应对Flume写入HBase速度变慢的问题。
摘要由CSDN通过智能技术生成

3b9408b09f40a408497d76f3990674b3.png

Flume事务

43e86d43b3f8d20bf0b6b0b79fbfa2a0.png

Put 事务流程

doPut:将批数据先写入临时缓冲区 putList

doCommit:检查 channel 内存队列是否足够合并

doRollback:channel 内存队列空间不足,回滚数据

Take 事务流程

doTake:将数据取到临时缓冲区 takeList,并将数据发送到 HDFS

doCommit:如果数据全部发送成功,则清除临时缓冲区 takeList

doRollback:数据发送过程中如果出现异常,rollback 将临时缓冲区 takeList 中的数据归还给 channel 内存队列

Flume Agent内部原理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值