Flume详解与安装部署教程

1、Flume概述

在这里插入图片描述
在一个完整的离线大数据处理系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架。

  • Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统
  • Flume支持在日志系统中定制各类数据发送方,用于收集数据;
  • Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

2. Flume的架构(5分钟)

  • Flume 的核心是把数据从数据源收集过来,再送到目的地。为了保证输送一定成功,在送到目的地之前,会先缓存数据,待数据真正到达目的地后,删除自己缓存的数据。
  • Flume分布式系统中最核心的角色是agent,flume采集系统就是由一个个agent所连接起来形成。
  • 每一个agent相当于一个数据传递员,内部有三个组件
    • source
      • 采集组件,用于跟数据源对接,以获取数据
    • channel
      • 传输通道组件,缓存数据,用于从source将数据传递到sink
    • sink
      • 下沉组件,数据发送给最终存储系统或者下一级agent中

3. Flume采集系统结构图(5分钟)

在这里插入图片描述

3.1 简单结构
  • 单个agent采集数据

在这里插入图片描述

3.2 复杂结构
  • 2个agent串联
    在这里插入图片描述
  • 多个agent串联
    在这里插入图片描述
  • 多个channel
    在这里插入图片描述

2、Flume安装部署

Flume安装很简单,解压好基本上就可以使用

  • 1、下载安装包

    • http://archive.apache.org/dist/flume/1.8.0/
      在这里插入图片描述
  • 2、规划安装目录

    • /opt/bigdata2.7
  • 3、上传安装包到服务器

  • 4、解压安装包到指定的规划目录

    • tar -zxvf flume-1.8.0-bin.tar.gz -C /opt/bigdata2.7
  • 5、重命名解压目录

    • mv flume-1.8.0-bin flume-1.8.0
  • 6、修改配置

    • 进入到flume安装目录下的conf文件夹中

      • 先重命名文件

        • mv flume-env.sh.template flume-env.sh
      • 修改文件,添加java环境变量

        • vim flume-env.sh
        export JAVA_HOME=/user/java/jdk1.8.0_141
        
        • vim flume-env.sh
        export JAVA_HOME=/user/java/jdk1.8.0_141
        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值