Source
flume1.6
exec
好处:实时监控文件变化
坏处:有丢数据的风险
spooling
好处:可以实现断点续传
坏处:不能实时监控文件变化
flume1.7
taildir
好处:断点续传,可以实时监控文件变换
Channel
file channel
数据存储在磁盘中 可靠性高 效率低
memory channel
数据存储在内存中,可靠性差,效率低
kafka channel
数据存储在kafka中,存储在磁盘中,可靠性高,省去了kafka sink,传输效率也高(flume 1.6的时候诞生的,pares AsAflumeEvent=true ,设为flase不起作用,在1.7版本修复了bug)