Flume 1.7 源码分析(二)整体架构

Flume的三大组件包括Source、Channel和Sink。Source作为数据来源,如Web Server日志,通过ExecSource监听并传递给Channel。Channel作为缓存队列,保证Source和Sink的读写速度匹配。Sink负责从Channel读取数据并存储到目标如HDFS或日志文件。启动时,SourceRunner和SinkRunner负责各自组件的运行,SourceRunner启动Source的监听和发送数据,SinkRunner循环调用Sink进行数据存储。
摘要由CSDN通过智能技术生成

Flume 1.7 源码分析(一)源码编译
Flume 1.7 源码分析(二)整体架构
Flume 1.7 源码分析(三)程序入口
Flume 1.7 源码分析(四)从Source写数据到Channel

3 整体架构

Flume有三大组件:Source、Channel、Sink。

Flume组件图

  • Source就是数据来源,例如Web Server产生日志后,可使用ExecSource执行tail -F命令后不断监听日志文件新生成的数据,然后传给Channel。
  • Channel就是一个缓存队列,由于读取数据和写入数据的速度可能不匹配,假如用同步完成的方式可能效率低下,
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值