ApcaheFlume
Welcome to Apache Flume
weixin_43563705
将自己的所学到的知识分析给大家
展开
-
Apache Flume : 简单案例
采集目录到HDFS 采集需求:服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去 根据需求,首先定义以下3大要素 采集源,即source——监控文件目录 : spooldir 下沉目标,即sink——HDFS文件系统 : hdfs sink source和sink之间的传递通道——channel,可用file channel 也可以用内存channel...原创 2019-12-04 21:13:33 · 4038 阅读 · 1 评论 -
Apache Flume : 安装部署[内含实战案例]
Flume安装部署 Flume的安装非常简单 上传安装包到数据源所在节点上 然后解压 tar -zxvf apache-flume-1.8.0-bin.tar.gz 然后进入flume的目录,修改conf下的flume-env.sh,在里面配置JAVA_HOME 根据数据采集需求配置采集方案,描述在配置文件中(文件名可任意自定义) 指定采集方案配置文件,在相应的节点上启动flume agent ...原创 2019-12-04 21:08:18 · 3901 阅读 · 2 评论 -
Apache Flume:详细介绍
概述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的软件。 Flume的核心是把数据从数据源(source)收集过来,再将收集到的数据送到指定的目的地(sink)。为了保证输送的过程一定成功,在送到目的地(sink)之前,会先缓存数据(channel),待数据真正到达目的地(sink)后,flume在删除自己缓存的数据。 Flume支持定制各类数据发送...原创 2019-12-04 21:02:41 · 6229 阅读 · 2 评论