flume总结笔记

Flume是一个分布式、可靠的日志聚合系统,能够从多种数据源收集数据,进行简单处理,并写入各种数据接收方。它支持级联,适用于大规模数据采集场景,包括从文件系统、实时日志、消息系统等收集数据,并将其存储到HDFS、HBase、Kafka等。Flume的特性包括数据传输的事务管理、可靠性、故障切换和数据过滤。
摘要由CSDN通过智能技术生成

flume:Flume是开源日志系统。是一个分布式、可靠和高可用的海量日志聚合的系统,
支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,
并写到各种数据接受方(可定制)的能力。

Flume简介及架构

Flume是什么
Flume是流式日志采集工具,Flume提供对数据进行简单处理并且写到各种数据接受方(可定制)的能力,
Flume提供从本地文件(spooling directory source)、实时日志(taildir、exec)、REST消息、 
Thrift 、Avro、Syslog、Kafka等数据源上收集数据的能力。 、
Flume针对特殊场景也具备良好的自定义扩展能力,因此,flume可以适用于大部分的日常数据采集场景

Flume能干什么
提供从固定目录下采集日志信息到目的地(HDFS, HBase, Kafka)能力。
提供实时采集日志信息(taildir)到目的地的能力。
Flume支持级联(多个Flume对接起来),合并数据的能力。
Flume支持按照用户定制采集数据的能力。

Flume是收集、聚合事件流数据的分布式框架。
     
Flume架构 (1)

Flume基础架构:Flume可以单节点直接采集数据,主要应用于集群内数据。
Flume多agent架构:Flume可以将多个节点连接起来,将最初的数据源经过收集,存储到最终的存储系统中。
主要应用于集群外的数据导入到集群内。 
Flume多agent架构中可以将多个Flume级联起来,级联场景主要应用于收集FusionInsight集群外的节点上的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值