【图文详细 】Flume 数据采集组件—— 体系结构/核心组件

Flume 的数据流由事件(Event)组成,Event 作为基本数据单位,包含日志数据和头信息。Source 生成并推入 Channel,Sink 负责持久化或转发事件。Agent 是最小运行单位,由 Source、Sink 和 Channel 构成。Source 包括 Syslog、Netcat 等,Sink 包括 HDFS、HBase 存储和 IPC 通信。Channel 提供内存、文件和 JDBC 等多种类型,支持事务和负载均衡。
摘要由CSDN通过智能技术生成

4、Flume 体系结构/核心组件 

 

4.1、概述 
Flume 的数据流由事件(Event)贯穿始终。事件是 Flume 的基本数据单位,它携带日志数据(字 节数组形式)并且携带有头信息,这些 Event 由 Agent 外部的 Source 生成,当 Source 捕获事 件后会进行特定的格式化,然后 Source 会把事件推入(单个或多个)Channel 中。你可以把 Channel 看作是一个缓冲区,它将保存事件直到 Sink 处理完该事件。Sink 负责持久化日志或 者把事件推向另一个 Source。

Flume 以 agent 为最小的独立运行单位。

一个 agent 就是一个 JVM。

单 agent 由 Source、Sink 和 Channel 三大组件构成。

如下图: 

 

4.2、Flume 三大核心组件 

Event

    Event 是 Flume 数据传输的基本单元。

    Flume 以事件的形式将数据从源头传送到最终的目的地。

    Event 由可选的 header 和载有数据的一个 byte array 构成。

    载有的数据度 flume

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值