Flume丢失数据的问题

在一些网络资料中有看到当Flume的数据量达到70MB/s以上时,就会出现丢失数据的情况。

但是根据Flume的架构原理,采用FileChannel的Flume是不可能丢失数据的,因为其内部有完善的事务机制(ACID)。

  • Source到Channel是事务性的,
  • Channel到Sink也是事务性的,

这两个环节都不可能丢失数据。

唯一可能丢失数据的是Channel采用MemoryChannel,

  • 在agent宕机时候导致数据在内存中丢失;
  • Channel存储数据已满,导致Source不再写入数据,造成未写入的数据丢失;

并且在实际开发生产环境中,还没有出现过Flume丢失数据的情况,因此Flume在数据量大的时候丢失数据的情况还有待商榷。

ps:Flume不会丢失数据,但是可能会造成数据重复,例如数据已经由Sink发出,但是没有接收到响应,Sink会再次发送数据,导致数据重复

转载链接:https://blog.csdn.net/wx1528159409/article/details/88737287

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值