02 flume收集数据输出到kafka

最新推荐文章于 2024-04-17 08:50:21 发布

张力的程序园

最新推荐文章于 2024-04-17 08:50:21 发布

阅读量209

点赞数 1

分类专栏： 24 kafka入门文章标签： flume kafka

本文链接：https://blog.csdn.net/langli204910/article/details/104894427

版权

24 kafka入门专栏收录该内容

3 篇文章 0 订阅

订阅专栏

上一节我们在CentOS中安装了kafka并对生产者消费者进行了测试。在实际生产中，flume经常配合kafka同时使用，本文将阐述如何使用flume收集数据到kafka。

1 系统、软件以及前提约束

CentOS 7 64 工作站作者的机子ip是192.168.100.200，请读者根据自己实际情况设置
已完成安装kafka并测试生产者消费者
https://www.jianshu.com/p/1a7b9970d073
xshell客户端
为去除权限对操作的影响，所有操作都以root进行

2 操作

使用xshell登录到192.168.100.200
修改flume-conf.properties，保存退出

a1.sources = s1 
a1.channels = c1 
a1.sinks = k1 
a1.sources.s1.type=exec 
a1.sources.s1.command=tail -F /root/kafka.log 
a1.sources.s1.channels=c1 
a1.channels.c1.type=memory 
a1.channels.c1.capacity=10000 
a1.channels.c1.transactionCapacity=100 
#设置Kafka接收器 
a1.sinks.k1.type= org.apache.flume.sink.kafka.KafkaSink 
#设置Kafka的broker地址和端口号 
a1.sinks.k1.brokerList=192.168.100.200:9092 
#设置Kafka的Topic 
a1.sinks.k1.topic=test 
#设置序列化方式 
a1.sinks.k1.serializer.class=kafka.serializer.StringEncoder 
a1.sinks.k1.channel=c1

确保kafka服务启动，确保topic已经创建且名称为test
创建待监听文件，并向其中不断加入数据

cd
touch  kafka.log
ping wh1993.net >> kafka.log

启动flume服务【注意，确保kafka服务已经启动】

cd /root/apache-flume-1.8.0-bin/bin
./flume-ng agent -c ../conf -f ../conf/flume-conf.properties -n a1 -Dflume.root.logger=INFO,console

启动kafka的消费者

cd /root/kafka_2.12-0.11.0.2/bin
# 启动kafka的消费者【注意，topic的名称为test】
./kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

观察消费者的启动窗口的打印内容，就是kafka.log中不断增加的内容。
以上，就是整合flume与kafka的过程。