Flume 事务处理过程详解

Flume 事务过程详解

主要事务处理过程:
在这里插入图片描述
1、Web Server :读数据,通过端口,本地文件读入数据。读取文件时有单个上传、批量上传以及断点续传模式。

2、Source :读数据,并将数据封装成事件。Source 将事务主动推入 Channel 中,而 Sink 是拉取事务。

3、Put 事务流程

  • doPut : 将批数据先写入临时缓冲区 putList
  • doCommit : 检查 channel 内存队列是否足够合并
  • doRollBack : channel 内存队列空间不足,回滚数据

4、Take 事务

  • doTake : 将数据取到临时缓冲区 takeList,并将数据发送到 HDFS
  • doCommit : 如果数据全部发送成功,则清除临时缓冲区 takeList
  • doRollback : 数据发送过程中如果出现异常,rollback 将临时缓冲区 takeList 中的数据归还给 channel 内存队列。
下一篇:Flume Agent 内部原理详解
加入小猿QQ群:947117563,一起玩转大数据!!写作不易,记得一键三连哦 0_0 !!
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值