flume 是分布式,高可靠 ,高可用,基于流式数据,强健性 ,高容错 ,故障转移与自动恢复,多数据来源接口,上手简单,一个集收集,聚合,移动大规模日志数据的服务。
官网下载地址 http://flume.apache.org/download.html
今天介绍以flume1.9.0版本为例
系统需求:
1、java 1.8 or later
2、足够的内存
3、足够的磁盘空间
4、机器的读写权限
下载压缩包,解压后,在conf目录中添加配置文件(比如 vim hancan.conf)
现在用最简单的配置来举例
source:source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy、自定义