flume agents topology

  Apache Flume is a distributed, reliable, and available system for efficiently collecting, aggregating and moving large amounts of log data from many different sources to a centralized data store.

 Flume Transcation (事务)

  Channel 中的数据只有在被Sink 端消费(也就是数据传输到下一个Agent或写入到文件后)才会在Channel中删除相应数据。

  从soucrce到channel:一旦事务中所有的事件全部传递到channel且提交成功,那么source就将该文件标记为完成。

  从channel到sink:如果下游事件没有被正常消费,那么事务将会回滚;且所有的事件都会保持到channel中,等待重新传递。

 Flume Interceptor(拦截器)

  Timestamp Interceptor: 时间戳拦截器,将当前时间戳(毫秒)加入到events header中,key名字为:timestamp,值为当前时间戳。

  Host Interceptor: 主机名拦截器。将运行Flume agent的主机名或者IP地址加入到events header中,key名字为:host(也可自定义)。

  Static Interceptor: 静态拦截器,用于在events header中加入一组静态的key和value。

  UUID Interceptor: UUID拦截器,用于在每个events header中生成一个UUID字符串

  Regex Filtering Interceptor:

  Regex Extractor Interceptor:

 Flume Channel Selectors

  Replicating(复制)同一个Event会发送给每一个Channel 中,默认使用;

  Multiplexing(复用)同一个Event只会选择多个Channel中的一个发送

  自定义Selectors

 

转载于:https://www.cnblogs.com/mrerror/p/10855772.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值