flume的事务实现

最新推荐文章于 2024-05-11 10:36:03 发布

lilyjoke

最新推荐文章于 2024-05-11 10:36:03 发布

阅读量3.7k

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lilyjoke/article/details/81363906

版权

Flume的事务机制确保了数据从source到channel，再到sink的可靠性。内存通道memory channel维护put和take事务，doPut由source触发，doTake由sink触发。在异常情况下，doRollback会回滚事件，保持数据一致性。事务机制采用At-least-once提交方式，可能导致事件重复，但保证了高容量数据传递的可靠性。批处理机制提高效率，如Kafka source以批处理方式处理事件。

摘要由CSDN通过智能技术生成

在flume的内部实现中事务是一个重要的概念，事务保证了数据的可用性（有别于数据库中的事务）。

下图的数据流是spooling directory source-> memory channel-> kafka sink，其中memory channel维护了两个事务，分别是put事务和take事务。

下面简要介绍一下事务的代码实现：

1. doPut(放入event)，该操作由source触发。

1.1 一般的source会在process方法中，将event提交到channel。但是spoolingdirectorysource比较特殊，它针对一个本地目录创建了ReliableSpoolingFileEventReader对象, 并起一个定时线程去读取其中的文件。在线程中，取到一批event后(文件中一行即为一个event)，直接调用ChannelProcessor的processEventBatch方法，将这批数据提交到channel中。

1.2 在ChannelProcessor对象中,调用栈为：reqChannel.put(event) -> BasicChannelSemantics.put -> BasicTransactionSemantics.put -> BasicTransactionSemantics.doPut。其中doPut是一个抽象方法，其具体实现放在各个channel的Transaction中。这里

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lilyjoke CSDN认证博客专家 CSDN认证企业博客

码龄13年

51: 原创

6万+: 周排名

230万+: 总排名

12万+: 访问

: 等级

890: 积分

1228: 粉丝

29: 获赞

24: 评论

119: 收藏

私信

关注

热门文章

分类专栏

Spark 6篇
JAVA 6篇
大数据 28篇
Spring 1篇
算法题 5篇
Android 1篇
Python 2篇
RIL 5篇
其他 7篇

最新评论

Spark2.4升级到Spark 3.2后，小文件数增多的问题解决
6871: 设置了没起作用为啥啊
基于Durid解析SQL语法树获取单查询该查询的最终输出字段
lilyjoke: 因为这个只做语法树的解析，就是制作sql文本的解析，并没有关联元数据信息去判断是否真的有这张表或这个字段。你要加上判断，就再参考元数据连接那部分就得了。我们也许场景不需要做两次元数据判断。
基于Durid解析SQL语法树获取单查询该查询的最终输出字段
Little friend: 博主，要是直接select一个表中不存在的字段居然还能返回啊，表中都不存在怎么还能返回
自定义child-first类加载器解决Jar包冲突
lilyjoke: CustomClassLoader的forName函数，里面有些业务逻辑所以没放上来，除了业务逻辑，其实就一个关键步骤： ClassA 对象A = Class.forName（ClassA完整包名, true ，CustomClassLoader中创建的childFirstClassLoader对象) 例如：parserClazz = Class.forName("org.apache.tika.parser.AutoDetectParser", true, loader)
自定义child-first类加载器解决Jar包冲突
a94522538: 哪来的forName..

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。