使用flume采集linux本地文件至kafka

编写配置文件

vim dir_kafka.conf
a1.sources = r1
a1.sinks = k1
a1.channels = c1
#对于source的配置描述 监听avro
a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir =/opt/access.log
a1.sources.r1.fileSuffix=.FINISHED
a1.sources.r1.deserializer.maxLineLength=5120
#对于source的配置描述 监听文件中的新增数据 exec
a1.sources.r1.type = exec
a1.sources.r1.command  = tail -F /opt/log/access.log
a1.sources.ri.shell = /bin/sh -c
#对于sink的配置描述 使用kafka做数据的消费
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.topic = kk7
a1.sinks.k1.brokerList = 192.168.88.11:9092,192.168.88.12:9092,192.168.88.13:9092
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.batchSize = 20
#对于channel的配置描述 使用内存缓冲区域做数据的临时缓存
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

#通过channel c1将source r1和sink k1关联起来
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
flume 启动命令
./flume-ng agent -c /usr/local/flume/conf -f /usr/local/flume/conf/dir-hdfs.conf -n a1 -Dflume.root.logger=INFO,console
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用Flume采集文件数据并将其发送到Kafka,需要进行以下步骤: 1. 安装和配置FlumeKafka。 2. 配置Flume的Source(数据来源)和Sink(数据接收端)。 例如,可以使用Exec Source来监控文件目录,然后使用Kafka Sink将数据发送到Kafka。在Flume的配置文件中配置如下: ``` # Source配置 agent.sources = mysource agent.sources.mysource.type = exec agent.sources.mysource.command = tail -F /path/to/myfile # Sink配置 agent.sinks = mysink agent.sinks.mysink.type = org.apache.flume.sink.kafka.KafkaSink agent.sinks.mysink.kafka.topic = mytopic agent.sinks.mysink.kafka.bootstrap.servers = localhost:9092 agent.sinks.mysink.kafka.flumeBatchSize = 20 agent.sinks.mysink.kafka.producer.acks = 1 # Channel配置 agent.channels = mychannel agent.channels.mychannel.type = memory agent.channels.mychannel.capacity = 1000 agent.channels.mychannel.transactionCapacity = 100 # Source和Sink绑定Channel agent.sources.mysource.channels = mychannel agent.sinks.mysink.channel = mychannel ``` 3. 启动Flume代理。 可以使用以下命令启动Flume代理: ``` $ bin/flume-ng agent --conf conf --conf-file example.conf --name agent -Dflume.root.logger=INFO,console ``` 其中,`--conf`参数指定Flume配置文件目录,`--conf-file`参数指定Flume配置文件的路径,`--name`参数指定Flume代理的名称,`-Dflume.root.logger`参数指定Flume的日志级别和输出位置。 4. 监控Kafka的消息。 可以使用命令行工具或Kafka客户端来监控Kafka的消息。例如,可以使用以下命令来监控`mytopic`主题的消息: ``` $ bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic mytopic --from-beginning ``` 这样就可以使用Flume采集文件数据并将其发送到Kafka了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值