Flume与HBASE、Kafka集成

最新推荐文章于 2024-01-28 14:32:43 发布

K. Bob

最新推荐文章于 2024-01-28 14:32:43 发布

阅读量770

点赞数

分类专栏： Flume 文章标签： Flume

本文链接：https://blog.csdn.net/ThreeAspects/article/details/102747637

版权

本文介绍了如何使用Flume从应用服务采集日志，并将其推送到HBASE和Kafka。首先配置Flume节点进行日志合并与预处理，然后通过SimpleAsyncHbaseEventSerializer实现HBASE集成，详细讲解了配置与数据写入过程。同时，还展示了日志格式转换以适应Kafka集成的需求。

摘要由CSDN通过智能技术生成

Flume与HBASE、Kafka集成相关配置

- Flume与HBASE集成
- Flume与Kafka集成

这里首先设置两台Flume采集应用服务日志，将数据Push到第三台Flume进行日志合并、预处理。然后通过两个Channel分别将数据发送到HBASE和Kafka中。关于Flume基础可以参照Flume解析。
这里配置三台节点机器，其中agent2、agent3节点配置flume，用于从应用服务将数据采集到agent1节点。以agent2节点为例修改配置文件。

agent2.sources = r1
agent2.channels = c1
agent2.sinks = k1

agent2.sources.r1.type = exec
agent2.sources.r1.command = tail -F /opt/datas/weblogs.log
agent2.sources.r1.channels = c1

agent2.channels.c1.type = memory
agent2.channels.c1.capacity = 10000
agent2.channels.c1.transactionCapacity = 10000
agent2.channels.c1.keep-alive = 5

agent2.sinks.k1.type = avro
agent2.sinks.k1.channel = c1
agent2.sinks.k1.hostname = bigdata-pro01
agent2.sinks.k1.port = 5555

Flume与HBASE集成

agent1.sources = r1
agent1.channels = kafkaC hbaseC
agent1.sinks = kafkaSink hbaseSink

agent1.sources.r1.type = avro
agent1.sources.r1.channels = hbaseC
agent1.sources.r1.bind = bigdata-pro01
agent1.sources.r1.port = 5555
agent1.sources.r1.threads = 5
//Define a memory channel called hbaseC on agent1
agent1