flume 面试题集锦

本文汇总了Flume面试的重要知识点,包括Flume的事务控制,如at least once和at most once机制;Flume Agent的内部机制,包括source、channel、sink的组成和角色;Flume的监控选项,如内置HTTP监控和Ganglia集成;性能调优建议,如channel选择、数据压缩和Java内存配置;以及Flume的高可用方案,涉及级联agent和failover策略。
摘要由CSDN通过智能技术生成

flume 面试题集锦

1. flume事务

在这里插入图片描述
在这里插入图片描述

上述是官网简介,可以看出事务体现在source到channel和channel到sink2个阶段
对于数据的事物控制,其实可以分为3种,
at least once,至少一次
at most once最多一次
exactly once刚好一次
顾名思义,刚好一次是最好的,不多也不少,mysql就是采用这种机制,但带来的性能损耗是非常大的.

大数据领域,一般采用至少一次,因为数据重复可以去重,但性能对于海量数据其实也是需要着重考虑的.数据也尽量不丢失,at most once则很可能数据丢失,并不适合大数据处理.

flume中有很多种source\channel\sink类型,并不是每种组合起来都能实现事物控制,例如exec source就不能实现事务控制,如果选择memeory channel,一旦机器断电,则数据就会丢失,也无法实现很好的事务控制

flume的事务控制有四个生命周期函数,start\commit\ro

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值