Flume内部原理图解
具体流程:
1)Source接收数据,交给Channel处理器进行处理event
2)处理器通过拦截器对event进行过滤清洗:比如时间拦截,分类等
3)经过拦截器处理的数据经过channel选择器,发往不同的channel;channel选择器有两种:一类Replicating Channel Selector,会将source中的event发往所有channel,能够冗余副本,提高可用性;Multiplexing Channel Selector:会根据event中header中的某个value将数据发到对应的channel
4)最后sink处理器处理每个channel中的事件