flume jvm调优_[Flume]Flueme原理学习笔记

Flume是一个高可用的日志采集系统,由Source、Channel和Sink组成。Source接收数据,Channel作为缓存,Sink负责数据传输。内存Channel和File Channel是常见的Channel类型。Flume支持拦截器和Channel选择器进行数据处理和分发。JVM调优包括增加Source数量、调整batchSize和优化Channel的Capacity与transactionCapacity。事务机制确保数据一致性,类似数据库事务。Flume-Kafka-HDFS架构用于削峰填谷。
摘要由CSDN通过智能技术生成

Flume 定义

Flume是一个高可用、高可靠的,分布式的海量日志采集、聚合和传输的系统。基于流式框架,灵活简单。

Agent

Agent 是一个JVM 进程,以事件的形式将数据从源头送至目的地,是Flume传输的基本单位

Source

负责接收数据到flume agent的组件

Channel

Channel 是位于Source和Sink 之间的缓存区。运行Source和Sink运行在不同的速率上; Channel是线程安全的,同时处理多个Source的写入操作和几个Sink的读取操作

Flume 自带两种Channel:Memory Channel和Source Channel

Sink

不断地轮询Channel中的数据并批量的移除他们,并将这些事件批量写入到存储或索引系统,或者发送到另一个Flume Agent

Sink是完全事务性的.Channel 批量删除数据之前,每个Sink用Channel启动一个事务,批量事件一旦写入存储系统或者送入下一个Agent,Sink就利用Channel提交事务,事务一旦被提交,该Channel从自己的内部缓冲区删除事件

Event

传输单元,以事件的形式将数据从源头送往目的地

重点一.Flume 组成架构

Flume三个主要组件:Source、Channel、Sink

一个flume被称为一个Agent

面试注意的点:

注意flume处理的都是Batch data

注意两种Channel:Memory Channel和File

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值