1. flume是什么?
分布式的,高可用的,数据采集传输系统。
2.flume怎么工作的?
它有三大组件,source负责读数据,sink负责写数据,channel再source和sink之间做缓冲,做解耦。
flume通过启动一个agent来工作 agent和agent之间可以级联,甚至组成复杂的拓扑结构。
3.flume的核心架构?
3.1 agent : flume采集系统是由一个个agent连接起来所形成的一个或简单或复杂的数据传输通道。
agent内部有三大组件:3.1.1 source :采集组件,用于跟数据源对接,以获取数据,他有各种各样的内置实现
3.1.2 sink : 下沉组件,用于往下一级agent传递数据或者向最终存储系统传递数据
3.1.3 channel : 传输通道组件,用于从source将数据传递到sink
4.flume中的一些核心概念理解:source、channel、sink、channel selector、sink processor、interceptor、event、transaction
4.1 source: 源组件
4.2 channel :通道 缓冲
4.3 sink : 下沉组件 写出
4.4 channel selector:source数据如何分发到所连接的多个channel
4.5 sink processor: 协调一个sink组如何去channel中获取数据写出
4.6