Flume与Kafka区别与联系【学习笔记】

本文对比了Flume和Kafka在数据收集和处理中的差异,Flume适合数据源固定且低并发的场景,而Kafka适用于高吞吐量。Flume直接集成流式系统可能导致数据堆积,而Kafka则能提供可靠的数据存储。通常采用Flume作为Kafka的生产者,利用其丰富的source和断点续存功能。
摘要由CSDN通过智能技术生成

区别:

  • Flume (Apache 日志收集系统),主要功能就是收集同步数据源的数据,并将数据保存到持久化系统中,适合数据来源比较广,数据收集结构比较固定的场景;
  • Kafka (Apache 分布式消息系统),主要是作为一个中间件系统的方式存在,适合高吞吐量和负载的情况,可以作为业务系统中的缓存消息通知系统数据收集等场景。

为什么还需要Flume作为日志收集系统?

  • 主要原因:Kafka 需要进行一些额外的开发,Flume 可以直接使用 Sink 将数据保存;
  • 次要原因:对于不需要高并发的业务场景,Flume 足够使用,而且Flume对于机器的性能要求低于 Kafka 的。

企业应用中,一般不用 Flume 直接与 SparkStreaming Flink 集成,原因如下:

(1)Flume 的 Sink 端直接和流式系统对接(连接到 Spar

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值