Flume的基本概念

Flume是Cloudera公司开源的分布式、可靠、高可用的日志采集系统,用于海量日志的收集。它包括Source、Channel和Sink三个核心组件,提供数据源定制和数据存储系统扩展。Flume NG取代了OG版本,简化了架构,取消了collector、master等组件,采用单一的Agent角色。Event是Flume传输的基本单元,由header和数据构成。Agent包含Source(接收或生成事件)、Channel(缓存事件)和Sink(传输事件)。Source类型包括系统集成、自动生成和IPC,Channel类型有Memory、File和JDBC,Sink则负责将数据传输到目的地,如HDFS、HBase等。
摘要由CSDN通过智能技术生成
一:Flume介绍
1.1、在hadoop生态圈中,Flume的位置。
1.2、Flume是什么?
    有Cloudera公司开源
    分布式、可靠、高可用的海量日志采集系统
    数据源可定制,可扩展。
    数据存储系统可定制,可扩展。
    中间件:屏蔽了数据源和数据存储系统的异构性。
1.3、Flume的两个版本?
    Flume OG
        OG:“Original Generation"
        0.9x或cdh3以及更早的版本。
        有agent、collector、master等组件构成。
    Flume NG
        NG:“Next/New Generation"    
        1.x或cdh4以及之后的版本。
        有Agent/client等组件构成。
          为什么要退出NG版本?
            精简代码
            架构简化
1.4、FlumeOG存在的问题
        Flume OG代码工程臃肿
        核心组件设计不合理
        核心配置不标准
        尤其是在Flume OG的最后一个发行版本0.94.0中,日志传输不稳定的现象尤为严重。
        Flume NG的特点
        NG只有一种角色的节点:代理节点(agent)
        没有collector,master节点。这是核心组件最核心的变化。
        去除了physical nodes,local nodes 的概念和相关内容。
        agent节点的组成也发生了变化,脱离了zookeeper。
1.5、Flume流程图
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值