目录
一、概述
1.什么是Flume
Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构,灵活简单
Flume最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到HDFS。
2.Flume基础架构
Agent:Agent 是一个 JVM 进程,它以事件的形式将数据从源头送至目的。
Agent = Source + Channel + Sink。
- Source:负责接收数据到 Flume Agent 的组件。
- Source 组件可以处理各种类型、各种格式的日志数据,包括 avro、thrift、exec、jms、spooling directory、netcat、taildir、sequenc