flume配置文件和实际场景理解

一、场景一描述:

线上api接口服务通过log4j往本地磁盘上打印日志,在接口服务器上安装flume,通过exec source收集日志,然后通过avro sink发送到汇总服务器上的flume;汇总服务器上的flume通过avro source接收日志,然后通过file_roll sink写到本地磁盘。

二、场景二描述:

  线上api接口服务通过log4j往本地磁盘上打印日志,在接口服务器上安装flume,通过exec source收集日志,然后通过avro sink将日志发送到汇总服务器上的flume;在汇总服务器上的flume,通过avro source接收到日志,然后通过hdfs sink备份到hdfs上。

上述是俩种比较常见的flume 应用场景,下面是对自定义数据源和数据输出的理解:

source - netcat 这是一种类似于生成socket服务器的方式, 常见实在数据源处配置此选项,用于测试比较方便

source - exec   这是监控文件的方式,如果文件内容发生变化就会触发收集

source - avro   这是相当于跨域转接数据的方式,常见与分布式实现多数据源汇总的方式,比如接受多个flume sink 

对于输出sink就比较多了

sink -loger 直接打印到控制台,当然这种用于测试的比较多

sink -sparkStreaming 传送到sparkStreaming

sink - kafka 传送到kafka

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值