Flume介绍+安装+案例

最新推荐文章于 2023-12-16 15:11:49 发布

小口天,

最新推荐文章于 2023-12-16 15:11:49 发布

阅读量446

点赞数

分类专栏： Flume

本文链接：https://blog.csdn.net/WQY992/article/details/98892030

版权

Flume是一个分布式、可扩展的日志收集系统，具备高可用性和容错性。文章介绍了Flume的基本架构，包括Source、Channel和Sink，详细阐述了其工作流程和原理。此外，还讲解了Flume的事务机制，确保数据的可靠性。文章提供了Flume 1.6.0的安装步骤，并分享了多个案例，包括收集Socket数据并输出到logger、写入本地磁盘以及在一个Agent内实现两套流的数据传输。

摘要由CSDN通过智能技术生成

定义

Flume是一个分布式，可扩展，可靠，高可用的服务。用于有效地收集，聚合和移动大量日志数据。
它具有基于流数据流的简单灵活的架构。
它具有可靠的可靠性机制和许多故障转移和恢复机制，具有强大的容错能力。
其设计宗旨是向Hadoop批量导入基于事件的海量数据

发展

Flume原始版本为Flume-OG，经过对整体架构的重新设计，已改名为Flume-NG
Flume发展到现在已经不仅限于日志采集，还可以通过简单的配置收集不同数据源的海量数据并将数据准确高效地传输到不同的中心存储。目前Flume可以对接的主流大数据框架有Hadoop、Kafka、ElasticSearch、Hive、HBase等