【Kafka】使用Flume对接Kafka

最新推荐文章于 2024-04-30 07:58:55 发布

飝鱻.

最新推荐文章于 2024-04-30 07:58:55 发布

阅读量805

点赞数 1

分类专栏： Kafka Flume 文章标签： kafka flume big data

本文链接：https://blog.csdn.net/heiren_a/article/details/122243449

版权

Flume 同时被 2 个专栏收录

12 篇文章 2 订阅

订阅专栏

Kafka

8 篇文章 0 订阅

订阅专栏

使用Flume对接Kafka

本篇需要用到Kafka与Flume，需要提前安装好两个软件，若还没安装，推荐先浏览下面推荐内容
Kafka的安装与基本命令的使用.
Flume的初步认识.

思考:为什么要将Kafka与Flume对接起来？
答：在实际工作中，Flume主要是用来采集日志文件的，并且用户文件一般不是单单的只给一个用户，可能会发送给多个用户。发送给的用户数可能也是不固定的，需要随时变换，而Flume却不能做到动态的增加、减少，所以我们可以使用Kafka配合着Flume来解决这一问题。

在flume中的job(自创)文件夹下创建运行文件,文件内容如下

# define
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F -c +0 /home/data/flume/kafka/test.log

# sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.bootstrap.servers = master:9092,slave1:9092,slave2:9092
a1.sinks.k1.kafka.topic = first
a1.sinks.k1.kafka.flumeBatchSize = 20
a1.sinks.k1.kafka.producer.acks = 1
a1.sinks.k1.kafka.producer.linger.ms = 1

# channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# bind
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

首先使用Kafka来创建一个消费者，要与运行配置文件的名称一样，命令如下
bin/kafka-topics.sh --create --zookeeper master:2181 --replication-factor 2 --partitions 1 --topic first
使first主题开始消费:bin/kafka-console-consumer.sh --bootstrap-server master:9092 --topic first
启动来进行测试，使用下述命令启动Flume
bin/flume-ng agent -c conf -name a1 -f /home/flume/job/kafka.conf
向文件中写入数据;echo '123456' > /home/data/flume/kafka/test.log
查看消费主题
现在在另一个节点上开启first主题:bin/kafka-console-consumer.sh --bootstrap-server master:9092 --from-beginning --topic first

飝鱻.

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【Kafka】使用Flume对接Kafka

使用Flume对接Kafka本篇需要用到Kafka与Flume，需要提前安装好两个软件，若还没安装，推荐先浏览下面推荐内容Kafka的安装与基本命令的使用.Flume的初步认识.思考:为什么要将Kafka与Flume对接起来？答：在实际工作中，Flume主要是用来采集日志文件的，并且用户文件一般不是单单的只给一个用户，可能会发送给多个用户。发送给的用户数可能也是不固定的，需要随时变换，而Flume却不能做到动态的增加、减少，所以我们可以使用Kafka配合着Flume来解决这一问题。在
复制链接

扫一扫

专栏目录