Flume 系列
Flume 深入浅出
Michealkz
这个作者很懒,什么都没留下…
展开
-
Flume进阶
案例1:双层Flume串联双层flume衔接,第一层从exec采集sink到avro中,第二层从上一层的avro接收采集输出到控制台第一层采用 exec source ===> memory channel ===> avro sink第二层采用 avro source ===> memory channel ===> logger sinkAgent1a1.so...原创 2020-05-20 09:15:41 · 378 阅读 · 0 评论 -
Flume自定义拦截器ETL分类型
Flume源码中的Eventpackage org.apache.flume;import java.util.Map;/** * Basic representation of a data object in Flume. * Provides access to data as it flows through the system. */ public interface ...原创 2019-10-23 21:46:15 · 1089 阅读 · 1 评论 -
Flume组件
1.SourceTailDir Source相比于Exec Surce、Spooling Directory Source、的优势有:断点续传、配置多目录。Fluem1.6之前需要自定义Source记录每次读取文件的位置实现断点续传。Exec Source 可以实时搜集数据,但是在Flume不运行,或者Shell命令出错的情况下,数据将会丢失。Spooling Directory Sour...原创 2019-10-22 22:07:07 · 314 阅读 · 0 评论 -
Flume 入门
Apache 是一个高可用、高可靠的,分布式的海量日志采集、聚合、传输系统,基于流式架构,灵活简单。Flume 最主要的作用就是实时读取服务器本地磁盘的数据,将数据写入HDFS中。Flume组成架构详解:Source输入端常用的类型有:spooling directory、exec、avro、syslog、netcat 等Put事务的流程:doPut:将批数据先写入临时缓冲区putListdo...原创 2019-09-24 16:17:22 · 1031 阅读 · 0 评论