源码可以去apache 官网下载
下面整理下flume的原理及代码实现:
flume是一个实时数据收集工具,hadoop的生态圈之一,主要用来在分布式环境下各服务器节点做数据收集,然后汇总到统一的数据存储平台,flume支持多种部署架构模式,单点agent部署,分层架构模式部署,如通过一个负载均衡agent将收集的数据分发到各个子agent,然后在汇总到同一个agent上,数据传输到统一的数据存储平台。
详细看博主:
https://www.cnblogs.com/zhangyinhua/p/7803486.html#_label1