flume与kafka实战配置

最新推荐文章于 2024-08-09 10:18:29 发布

wtzhm

最新推荐文章于 2024-08-09 10:18:29 发布

阅读量1.7k

点赞数 2

分类专栏： sparkstream 文章标签： flume与kafka配置 flume配置

本文链接：https://blog.csdn.net/wtzhm/article/details/84952305

版权

sparkstream 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

flume与kafka实战配置

1. 概述

在实战中，产生日志文件的服务器和hadoop集群一般不是在同一个服务器上，这时需要使用Flume avro架构模型，在web服务器上搭建一个flume,在hadoop集群上搭建一个flume。在这方便测试我们使用如下架构测试.

2. Flume avro架构模型

3.flume-webserver.properties 配置文件

特别说明：下面配置是flume 1.6

exec_memmory_avro.sources =exec_source
exec_memmory_avro.sinks = avro_sink
exec_memmory_avro.channels = memory_channel

exec_memmory_avro.sources.exec_source.type = exec
exec_memmory_avro.sources.exec_source.command  =  tail -f /hadoopData/exe.log （方便测试，使用该向该文件输入内容）
 
exec_memmory_avro.sinks.avro_sink.type = avro
exec_memmory_avro.sinks.avro_sink.hostname = 192.168.126.32 (avro sink对接avro source的地址，一定要根据自己环境更改。也可用主机名)
exec_memmory_avro.sinks.avro_sink.port = 3033

exec_memmory_avro.channels.memory_channel.type = memory
exec_memmory_avro.channels.memory_channel.capacity = 1000
exec_memmory_avro.channels.memory_channel.transactionCapacity = 100

exec_memmory_avro.sources.exec_source.channels = memory_channel
exec_memmory_avro.sinks.avro_sink.channel = memory_channel

启动flume：  flume-ng agent --name exec_memmory_avro --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/flume-webserver.properties -Dflume.root.logger=INFO,console

4. flume-hadoop-cluster.properties 配置文件

特别说明：下面配置是flume 1.6

avro_memmory_kafka.sources =avro_source
avro_memmory_kafka.sinks = kafka_sink
avro_memmory_kafka.channels = memory_channel
 
avro_memmory_kafka.sources.avro_source.type = avro
avro_memmory_kafka.sources.avro_source.bind = 0.0.0.0  (相当于服务器绑定一个本机地址，0.0.0.0表示自动绑定本机地址)
avro_memmory_kafka.sources.avro_source.port = 3033   (需要与web的sink端保持一致)

avro_memmory_kafka.sinks.kafka_sink.type = org.apache.flume.sink.kafka.KafkaSink
avro_memmory_kafka.sinks.kafka_sink.topic = test11 （kafka上创建的topic）
avro_memmory_kafka.sinks.kafka_sink.brokerList = master:9092,slave1:9092,slave2:9092
avro_memmory_kafka.sinks.kafka_sink.batchSize = 3
avro_memmory_kafka.sinks.kafka_sink.requiredAcks = 1

avro_memmory_kafka.channels.memory_channel.type = memory
avro_memmory_kafka.channels.memory_channel.capacity = 1000
avro_memmory_kafka.channels.memory_channel.transactionCapacity = 100

avro_memmory_kafka.sources.avro_source.channels = memory_channel
avro_memmory_kafka.sinks.kafka_sink.channel = memory_channel

启动flume： flume-ng agent --name avro_memmory_kafka --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/flume-hadoop-cluster.properties -Dflume.root.logger=INFO,console

5. 启动软件说明

1）使用到kafka需要启动：

启动zookeeper: zkServer.sh start

启动kafka: kafka-server-start.sh -daemon $KAFKA_HOME/config/server.properties

启动kafka消费者：kafka-console-consumer.sh --zookeeper master:2181,slave1:2181,slave2:2181 --topic test11 --from begginning

2 ) 先启动hadoop集群的flume：

flume-ng agent --name avro_memmory_kafka --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/flume-hadoop-cluster.properties -Dflume.root.logger=INFO,console

启动web日志服务器的flume：
flume-ng agent --name exec_memmory_avro --conf $FLUME_HOME/conf --conf-file $FLUME_HOME/conf/flume-webserver.properties -Dflume.root.logger=INFO,console

3 ) 输入文件内容，看kafka消费者是否接收到内容

进入到hadoopData目录下，写入字符到exe.log中

echo flume-kafka-setting-testging>>exe.log

查看kafka消费者，是否接收到内容