整合Flume和Kafka的综合使用

最新推荐文章于 2024-08-03 12:56:55 发布

慢熟的孩子

最新推荐文章于 2024-08-03 12:56:55 发布

阅读量385

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/qq_45400755/article/details/102718518

版权

大数据专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文介绍了如何综合使用Flume和Kafka进行实时数据采集。通过配置avro-memory-kafka和exec-memory-avro.conf文件，启动Flume进程，然后启动Kafka并创建hello_topic主题。最终展示所有进程启动后的运行状态，实现数据采集流程。

摘要由CSDN通过智能技术生成

在这里插入图片描述

接下来是flume的各个配置文件

avro-memory-kafka

avro-memory-kafka.sources = avro-source
avro-memory-kafka.sinks = kafka-sink
avro-memory-kafka.channels = memory-channel

avro-memory-kafka.sources.avro-source.type = avro
avro-memory-kafka.sources.avro-source.bind = 192.168.0.230
avro-memory-kafka.sources.avro-source.port = 44444

avro-memory-kafka.sinks.kafka-sink.type = org.apache.flume.sink.kafka.KafkaSink
avro-memory-kafka.sinks.kafka-sink.brokerList = 192.168.0.230:9092
avro-memory-kafka.sinks.kafka-sink.topic = hello_topic
avro-memory-kafka.sinks.kafka-sink.batchSize = 5
avro-memory-kafka.sinks.kafka-sink.requiredAcks =1

avro-memory-kafka.channels.memory-channel.type = memory

avro-memory-kafka.sources.avro-source.channels = memory-channel
avro-memory-kafka.sinks.kafka-sink.channel = memory-channe

exec-memory-avro.conf

exec-memory-avro.sources = exec-source
exec-memory-avro.sinks = avro-sink
exec-memory-avro.channels = memory-channel

exec-memory-avro.sources.exec-source.type = exec
exec-memory-avro.sources.exec-source.command = tail -F /home/hadoop/data/data.log
exec-memory-avro.sources.exec-source.shell = /bin/sh -c

exec-memory-avro.sinks.avro-sink.type = avro
exec-memory-avro.sinks.avro-sink.hostname = 192.168.0.230
exec-memory-avro.sinks.avro-sink.port = 44444

exec-memory-avro.channels.memory-channel.type = memory

exec-memory-avro.sources.exec-source.channels = memory-channel
exec-memory-avro.sinks.avro-sink.channel = memory-channel

开启flume进程

首先开启avro-memory-kafka.conf·
接着开启exec-memory-avro.conf

flume-ng agent --name avro-memory-kafka --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/avro-memory-kafka.conf -Dflume.root.logger=INFO,consol

flume-ng agent --name exec-memory-avro  --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/exec-memory-avro.conf -Dflume.root.logger=INFO,consol

之后开启kafka

kafka-server-start.sh $KAFKA_HOME/config/server.properties

接着开启hello_topic

kafka-console-consumer.sh --zookeeper 192.168.0.230:2181 --topic hello_topic

开启所有进程如下图

在这里插入图片描述

之后模拟实时数据采集

在这里插入图片描述

慢熟的孩子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录