Flume学习10_Flume->Kafka数据流操作

最新推荐文章于 2024-04-07 12:13:48 发布

Wang_Zhenwei

最新推荐文章于 2024-04-07 12:13:48 发布

阅读量1.3k

点赞数

分类专栏： Flume 原创文章标签： Flume Kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wang_zhenwei/article/details/49516063

版权

原创同时被 2 个专栏收录

105 篇文章 0 订阅

订阅专栏

27 篇文章 0 订阅

订阅专栏

Kafka启动

启动Zookeeper和Kafka，过程省略

新建一个Topic，并启动，Topic的名字与下面的名字应该对应，都是topic1：

[hadoop@Slave1 bin]$ sh kafka-topics.sh --create --topic flume1 --replication-factor 1 --partitions 1 --zookeeper Slave1:2181

Created topic "flume1".

[hadoop@Slave1 bin]$ sh kafka-console-consumer.sh --zookeeper Slave1:2181 --topic flume1 --from-beginning

Flume配置

安装好Flume、Zookeeper和Kafka

在Flume的conf目录下，新建一个名为flume-kafkaconf.properties的文件

文件的内容是：

a1.sources = r1

a1.sinks = kafkaSink

a1.channels = memoryChannel

a1.sources.r1.type = spooldir

a1.sources.r1.spoolDir = /home/hadoop/flumeSpool

a1.sources.r1.fileHeader = true

a1.sources.r1.deletePolicy = never

##########the type of channel is kafka#########

a1.channels.memoryChannel.type = memory

a1.channels.memoryChannel.capacity = 10000

a1.channels.memoryChannel.transactionCapacity = 1000

a1.channels.memoryChannel.byteCapacityBufferPercentage = 20

a1.channles.memoryChannel.byteCapacity = 80000

##########the type of channel is kafka#########

a1.sinks.kafkaSink.type = org.apache.flume.sink.kafka.KafkaSink

a1.sinks.kafkaSink.topic=flume1

a1.sinks.kafkaSink.brokerList=Slave1:9092,Slave2:9092,Slave3:9092

a1.sinks.kafkaSink.requiredAcks=1

a1.sinks.kafkaSink.batchSize = 20

#a1..sinks.kafkaS

##########the type of sink is kafka#########

a1.sources.r1.channels = memoryChannel

a1.sinks.kafkaSink.channel = memoryChannel

内容说明：

Sink是kafka，Channel是Memory；

源的类型是spooldir，直接从本地读取文件，要读取的文件放在了home/hadoop/flumeSpool，文件读取结束后，不会删除（另一种选择是立即删除）；

Channel类型是内存；

Sink类型是Kafka，最后传递给三台机器：Slave1、Slave2、Slave3，Kafka消费的topic类型是flume1。

Flume增加关于Kafka的JAR文件包

内容省略

Flume启动

[hadoop@Master flume]$ bin/flume-ng agent -c ./conf/ -f conf/flume-kafkaconf.properties -Dflume.root.logger=INFO,console -n a1

备注：这里的a1与配置文件里的a1对应。

启动后，Kafka端就能收到数据。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Flume学习10_Flume->Kafka数据流操作

Kafka启动启动Zookeeper和Kafka，过程省略新建一个Topic，并启动，Topic的名字与下面的名字应该对应，都是topic1：[hadoop@Slave1 bin]$ sh kafka-topics.sh --create --topic flume1 --replication-factor 1 --partitions 1 --zookeeper Slave1
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。