Flume原理并与Kafka结合原因

Flume是一个分布式的、可靠的日志收集、聚合、传输系统,简单来说就是将文件从A地点移动到B地点。

Flume可以收集包含文件、Socket数据包等各种形式的数据,并且能够存储到HDFS、Hbase、Hive等。

因此Flume的最大特点是具有很高的兼容性和自定义扩展能力。
 

其核心为Agent,包含三个组件,Source、Sink等

  • Source:采集源,用于同数据源对接
  • Channel通道,用于内部的数据传输,从Source到Sink
  • Sink目标池,采集数据传输的目的地。

Kafka为啥要跟Flume共用

线上的服务很难直接去修改接口,也就是很难从一个服务将数据或者日志送入kafka,因此通过Flume作为数据通道进行对接

也就是Flume用于服务和Kafka对接,从而搭建日志采集系统。flume在企业里一般都是数据采集,然后落地动作。比如flume采集nginx日志,然后写入kafka,然后再用flume消费kafka数据,入hdfs。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值