Flume, Kafka和NiFi,大数据实时日志数据收集、数据获取技术哪家强?

大数据

作者Tony Siciliani  本文为36大数据独译,译者:随风

我们在建设一个大数据管道时,需要在Hadoop生态系统前仔细考虑,如何获取大体量、多样化以及高速性的数据。在决定采用何种工具以满足我们的需求时,最初对于扩展性、可靠性、容错性以及成本的考虑便发挥了作用。本文,我们将聚焦于三种Apache获取工具:Flume, Kafka, and NiFi。这三种工具在横向比较中都展示出了良好的性能,同时还提供了一种插件体系结构,在这种结构中可通过定制组件来使功能得到扩展。

 Apache Flume

  一个Flume部署包括一个或多个配置有拓扑结构的agent。Flume Agent是一个JVM进程用来控制Flume拓扑结构的基本构件,其中包括source, channel 和sink。Flume客户先把event传送到source,source再把这些events成批放置到一个叫做channel的暂时缓冲区,然后数据从此流向连接数据终端的sink。一个sink也可以是其它Flume agents的后续数据资源。Agent之间可以被连接,并且含有多个source,channel和sink。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值