第一个:Avro Source 阿波罗source一定会用到的
flume采集数据,存在单点故障,希望数据再有一个flume需要一个RPC远程通讯框架。
第二个:Exec Source 执行命令行 tail -f可以监控结尾的变化数据。
第三个:spooling Directory和目录相关
第四个:Taildir Source:使用频率很高,监控本地文件
第五个:Kafka Source,数据可以从Kafka读,也可以写到Kafka里去
可以从本地
04_Flume入门_组件介绍
最新推荐文章于 2023-05-10 16:17:37 发布
本文介绍了Flume的常用组件,包括Avro Source、Exec Source、Spooling Directory、Taildir Source、Kafka Source等数据采集方式,以及HDFS Sink、Hive Sink、Logger Sink、Avro Sink等数据输出方式。此外,还提到了Memory Channel、JDBC Channel和File Channel等数据通道,以及Flume的Channel Selectors和Sink Processors在数据流向控制中的作用。
摘要由CSDN通过智能技术生成