概念:
FLume是Cloudera提供的一个高可用,高可靠,分布式的海量的日志采集,聚合,传输系统,FLume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接收方(可定制)的能力。
设计目标:
可靠性:end to end(exactly once)
Store on failure(数据接收方crash时,将数据写到本地,待恢复后,继续发送)
Best effort(数据发送到接收方后,不会进行确认)
可管理性:所有Source,Channel和Sink由Agent统一管理,
可扩展性:Flume采用三层架构,分别为Source,Channel,Sink。每一层均可以水平扩展
Flume能够支持多种数据源并且输出多种数据源,能够支持多种数据格式的数据
发展历程:
1.09年7月,从Cloudera诞生
2.10年11月,Cloudera开源了第一个可用版本0.9.2,0.9.x这个系列的版本也被称为FLume-OG