首先,flume属于一个系统(也可以说是一种引擎),系统由三大组件组成:source、channl、sink,构成系统生态。
event:是Flume定义的一个数据流传输的小单位。红线内是一个agent,本质上是一个JVM(虚拟机),控制数据从数据源流向指定的目的地。
1.source:负责接受各种类型的数据,包括avro、exec、spooldir、netcat等。主要作用就是:接受数据
2.channel:形成一个缓冲区,来自source的数据大量涌入时,内存无法承载。主要作用就是:一个数据的缓冲池
3.sink:从channel中不断的获取数据,主要作用就是:定义了数据输出的方式和目的地。
以上三种组件都是由不同类型的小组件组成,可以应对不同的数据来源和数据输出。
希望您在评论区留下您宝贵意见,万分感谢!