01_日志收集系统Flume_概述

flume是日志收集系统。cloudera开源给apache的开源软件,主要用于收集app和web等的软件产生的日志文件,写入数据总线如kafka,再从kafka中把数据分发到storm,hdfs,es等多种目的地。用于多种需求。flume 1.x后的版本叫flume-NG,之前的OG,NG重构了OG的代码和架构。此系列记录的是NG。
flume提供两种功能,1:收集日志。2分发日志。

针对这两个功能,分析flume的组件:

1:flume source:用于收集日志等数据源,并且默认提供了多个实现了。

2:flume sink:分发日志到各种外部存储中。并且默认提供了多个实现了。

3:flume channel:为source收集的数据提供个暂存的空间,缓冲作用。有多个实现。


Flume在storm中的作用

app,web等多种日志文件数据源 --》flume --》kafka --》 storm --》 hbase。


Flume在hive中的作用
app,web等多种日志文件数据源 --》flume --》kafka --》 flume--》 hdfs --》hive。

app,web等多种日志文件数据源 --》flume --》kafka --》 storm --》 hbase。


Flume在es中的作用
app,web等多种日志文件数据源 --》flume --》kafka --》 flume--》 es 。


从kafka数据总线开始,做三个消费者,一个走storm,一个走hive,一个走es搜索。


可见flume在大数据系统中起到了收集日志文件,分发消息流的作用。因此要弄好后面几个系统,整好flume是有必要的。

app,web等多种日志文件数据源 --》flume --》kafka --》 storm --》 hbase。
Flume在hive中的作用
app,web等多种日志文件数据源 --》flume --》kafka --》 flume--》 hdfs --》hive。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值