二十、《大数据项目实战之用户行为分析》Flume数据实时写入Kafka

我们已经知道,Kafka适合用于对数据存储、吞吐量、实时性要求比较高的场景。而对于数据的来源和流向比较多的情况,则适合使用Flume,且Flume不提供数据存储功能而是侧重于数据采集与传输。在实际开发中,常常将Flume与Kafka结合使用,从而提高系统的性能,使开发起来更加方便。

数据流架构

根据前面的系统数据流设计,需要将Flume合并后的日志数据以副本的方式分成两路(两路数据相同):一路进行实时计算;另一路进行离线计算。将需要实时计算的数据发送到实时消息系统Kafka进行中转,将需要离线计算的数据存储到HBase分布式数据库中。

本节在前面的基础上继续进行完善,将centos03节点的Flume接收到的数据写入到Kafka中。整个过程的数据流架构如图

具体操作步骤如下。

配置centos03节点的Flume

Flume的Sink组件可以配置多个目的地,其中就包括Kafka,即可以将数据写入到Kafka的主题中。

在centos03节点中创建Flume配置文件flume-kafka.propertie

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据张老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值