flume----初步安装与配置

目录标题

    • **flume的简单介绍**
      • ⭐flume的**核心组件**
      • ⭐**核心特点**
    • **安装部署**
      • 1)**解压安装包**
      • 2)**修改名字** **(配置文件时,更方便)**
      • **3)⭐⭐配置文件**
      • 4)**兼容Hadoop**
      • 5)**配置环境变量**
      • 6)**测试flume**
    • **⭐启动flume**
      • 1)在`flume`中创建空目录`jobs`
      • 2)在`jobs`内添加文件
      • **最终启动**

flume的简单介绍

Flume 是一个开源的 分布式日志收集系统,由 Apache 开发,主要用于高效地 采集、聚合和传输海量日志数据 (比如网站点击日志、服务器监控日志等),并将这些数据可靠地传递到 目标存储 (如 HDFS、HBase、Kafka 等)

⭐flume的核心组件

1.source(数据接收源头)

  • 负责接数据
    例,监听日志文件的新增内容

2.channel(通道)

  • 负责临时存储数据,确保数据不会丢失,相当于“缓冲区”

  • 存在原因
    数据的 “输入”“输出” 速度有时不同,为了避免数据丢失

3.sink(数据的输出)

  • 负责“送数据”,比如将数据写入
    HDFSkafka

核心特点

  1. 可靠性
  • 数据在传输过程中会持久化缓存(Channel),即使系统故障,数据也不会丢失
  1. 扩展性
  • 可横向扩展多个 Agent(Flume 节点)处理更大数据量
  1. 灵活性
  • 支持多种数据源(HTTP、日志文件、Kafka 等)和目的地(HDFS、HBase、ES 等)

  • 可自定义数据过滤、格式转换等逻辑

安装部署

1)解压安装包

tar -zxvf 文件名 - C 位置

tar -zxvf apache-flume-1.9.0-bin.tar.gz -C /opt/module/

2)修改名字 (配置文件时,更方便)

先进入到 flume 解压后所在的位置,然后修改

mv 原名 更改后的名字

mv apache-flume-1.9.0 flume

3)⭐⭐配置文件

所配置的在flumeconf里面
(zookeeper也是)
切到conf
再配置
flume-env.sh.template

log4j.properties

  • flume-env.sh.template文件
    保留原本的 内容 防止后续使用
    可以 将此文件复制一份 更名为flume-env.sh
cp flume-env.sh.template flume-env.sh

内容均配置到flume-env.sh

⭐添加jdk的路径

export JAVA_HOME=/opt/module/jdk
  • log4j.properties文件

添加:

flume.log.dir=/opt/module/flume/logs

4)兼容Hadoop

flumelib 下的
guava-11.0.2.jar 改名,以兼容hadoop-3.1.3

[root@hadoop102 lib] mv  guava-11.0.2.jar  guava-11.0.2.jar.bak

文件后.bak 可以 架空 此文件,以便兼容 hadoop-3.1.3

5)配置环境变量

vi /etc/profile添加 flumeexport

export FLUME_HOME=/opt/module/flume
export PATH=$PATH:$FLUME_HOME/bin

生效环境变量文件

source /etc/profile

6)测试flume

flume-ng version检查版本

⭐启动flume

启动时,需要进一步配置

1)在flume中创建空目录jobs

mkdir jobs

2)在jobs内添加文件

文件名为flume-netcat-logger.conf

vi flume-netcat-logger.conf

里面的内容是 flume 的启动内容

  • ① 将组件命名
  • ②描述组件/配置源 source
  • ③将一个事件缓冲到channel
  • ④描述组件sink
  • ⑤将输入源source输出sink
    管道channel联系起来

如图
在这里插入图片描述

最终启动

bin/flume-ng agent -n a1 -c conf/ -f jobs/flume-netcat-logger.conf -Dflume.root.logger=INFO,console
nc hadoop01 10050
### Apache Flume 下载安装教程 #### 准备工作 为了成功下载并安装Apache Flume,需先确认操作系统环境满足最低需求。通常情况下,Linux/Unix/Mac OS X 和 Windows 都支持运行Flume[^4]。 #### 获取软件包 访问官方网址获取最新版本的Flume压缩包。官方网站提供了详细的说明文档以及不同平台对应的二进制文件供用户选择下载[^1]。 #### 解压文件 下载完成后解压缩到指定位置,例如 `/usr/local/flume` 或者 `C:\flume\apache-flume-x.x.x-bin` (Windows). ```bash tar zxvf apache-flume-*.tar.gz -C /usr/local/ cd /usr/local/apache-flume-* ``` 对于Windows用户,则可以直接通过WinRAR或其他工具打开zip格式的压缩包,并将其释放至目标路径下。 #### 设置环境变量 编辑 `.bashrc`, `.zshrc` 文件或系统的环境变量设置界面,在其中加入如下内容以便于命令行调用: ```bash export FLUME_HOME=/path/to/flume export PATH=$PATH:$FLUME_HOME/bin source ~/.bashrc # 刷新当前shell会话中的更改 ``` 此时可以在任意终端输入 `flume-ng version` 来验证是否正确设置了环境变量。 #### 启动测试实例 创建简单的agent配置文件用于初步检验安装成果。可以参照官方提供的示例模板编写自己的conf文件: ```properties # example.conf: An example agent configuration for Apache Flume. # ... a1.sources = r1 a1.sinks = k1 a1.channels = c1 ... ``` 保存上述配置后执行以下指令来启动Agent: ```bash flume-ng agent --name a1 --conf ./conf --conf-file ./example.conf ``` 如果一切正常的话,应该能够看到类似于下面的日志输出表示服务已经就绪等待接收数据流了: ``` INFO node.PollingPropertiesFileConfigurationProvider ... Component type: source, class: org.apache.flume.source.NetcatSource ... INFO instrumentation.MonitoredCounterGroup ... Monitored counter group for type: SINK, name: k1: Successfully registered new MBean ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值