Flume： ------ Channel-通道、Memory、JDBC、Kafka、File Channel。

最新推荐文章于 2022-04-06 19:59:14 发布

姜同学的学习笔记

最新推荐文章于 2022-04-06 19:59:14 发布

阅读量905

点赞数

分类专栏： flume分布式文章标签： flume

本文链接：https://blog.csdn.net/weixin_45764675/article/details/106360644

版权

flume分布式专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Apache Flume

flume官方用户指南网址

Channel-通道

Memory Channel

将Source数据直接写入内存，不安全，可能会导致数据丢失。
在这里插入图片描述

transactionCapacity <= capacity

a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

JDBC Channel

在这里插入图片描述
事件存储在数据库支持的持久性存储中。 JDBC通道当前支持嵌入式Derby。这是一种持久通道，非常适合可恢复性很重要的流程。-存储非常重要的数据，的时候可以使用jdbc channel

a1.channels.c1.type = jdbc

Kafka Channel

在这里插入图片描述
将Source采集的数据写入外围系统的Kafka集群。

a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = CentOS:9092
a1.channels.c1.kafka.topic = topic_channel
a1.channels.c1.kafka.consumer.group.id = g1

# 声明基本组件 Source Channel Sink example10.properties
a1.sources = s1
a1.sinks = sk1
a1.channels = c1
# 配置Source组件,从Socket中接收⽂文本数据
a1.sources.s1.type = netcat
a1.sources.s1.bind = CentOS
a1.sources.s1.port = 44444
# 配置Sink组件,将接收数据打印在⽇日志控制台
a1.sinks.sk1.type = logger
# 配置Channel通道，主要负责数据缓冲
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = CentOS:9092
a1.channels.c1.kafka.topic = topic_channel
a1.channels.c1.kafka.consumer.group.id = g1
# 进⾏行行组件间的绑定
a1.sources.s1.channels = c1
a1.sinks.sk1.channel = c1

File Channel

在这里插入图片描述
使用文件系统作为通道的实现，能够实现对缓冲数据的持久化。

a1.channels.c1.type = file
a1.channels.c1.checkpointDir = /root/flume/checkpoint
a1.channels.c1.dataDirs = /root/flume/data

姜同学的学习笔记

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Flume： ------ Channel-通道、Memory、JDBC、Kafka、File Channel。

Apache Flumeflume官方用户指南网址Channel-通道Memory Channel将Source数据直接写入内存，不安全，可能会导致数据丢失。transactionCapacity <= capacitya1.channels.c1.type = memorya1.channels.c1.capacity = 1000a1.channels.c1.transactionCapacity = 100JDBC Channel事件存储在数据库支持的持久性存储中。
复制链接

扫一扫