Flume问题整理

Flume相关问题归纳

  1. Flume 的Source、Sink、Channel的作用?
    ①source组件是专门用来收集数据的,可以处理各种类型、各种格式的日志数据,包括avro、thrift、exec、spooling directory、syslog
    ②Channel组件对采集到的数据进行缓存,可以存放在Memory或File中
    ③Sink组件是用于把数据发送到目的地的组件,目的地包括 avro、HDFS、file、logger还有一些自定义sink
  2. Flume的Channel Selector
    channel选择器,可以让不同的项目日志通过不同的channel到不同的sink中去,有两种类型
    (Replicating Channel Selector会将source过来的数据发往所有的channel)
    (Mutiplexing Channel Selector 会选择哪些数据发往哪些Channel)
  3. 事务机制:Flume的事务机制
    Flume使用两个独立的事务分别负责从Source到Channel,以及Channel到Sink的事件传递,比如spooling directory source 为文件的每一行创建一个事件
    一旦事务中的所有事件全部传递到Channel且提交成功,那么source就将该文件标记为完成。同理,事务用类似的方法处理Channel到Sink的传递过程,如果因为某种原因使得事件无法记录,
    那么事务将会回滚。且所有事件都会保持到Channel中,等待重新传递。
  4. Flume的数据会丢失吗?
    根据Fl
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值