Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的 海量日志采集、聚合和传 输的系统 。 Flume 基于流式架构,灵活简单,动态采集。 只能识别文档,不能识别PPT,图片等其他格式 最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到 HDFS 。