Flume日志采集工具
一,Flume 简介
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
当前Flume有两个版本 Flume 0.9X 版本的统称Flume-og,Flume1.X版本的统称Flume-ng。由于Flume-ng经过重大重构,与Flume-og有很大不同,使用时请注意区分。
数据采集我们使用Flume,官方网站:https://flume.apache.org/
二,Flume下载
-
进入官方后,我们可以看到左侧的Download,点击
-
在这能看到当前最新版本和历史版本仓库,这里可以直接下载最新版本。不过我现在需要的是1.9.0版本,那么我就点击下边的跳转。
-
可以看到历史版本,找到 “喜欢”(需要)的版本,进入
-
然后点击需要的格式下载即可,这里我们需要在linux中使用,则下载二进制文件(bin),第一个
-
等待下载完即可
三、Flume安装
-
上传安装包到数据源所在节点上,通俗点讲就是上传到你的Linux系统中,在这我们使用 Xftp软件 将其上传到自己创建的 /opt/tools/ 中,来存放安装包。
-
解压,到自己专门存放软件的目录下,例如 /opt/server/
tar -zxvf apache-flume-1.9.0-bin.tar.gz -C /opt/server
-
为了方便,将目录名改为flume
mv apache-flume-1.9.0-bin flume
-
进入到flume目录,修改conf下的flume-env.sh,配置JAVA_HOME,目的是为其指定一个用来启动自己的Java(JDK)
cd /opt/server/flume/conf # 先复制一份flume-env.sh.template文件 cp flume-env.sh.template flume-env.sh # 修改 vim flume-env.sh export JAVA_HOME=/opt/server/jdk1.8.0_371
注意,加入的export语句,要指定为自己在Linux中安装的JDK路径和版本!
四、Flume环境变量配置
-
打开系统环境变量配置文件 profile
vim /etc/profile
-
增添以下内容:
Flume的目录 /opt/server/flume
Flume的bin目录 /opt/server/flume/bin 可以简写为 F L U M E H O M E / b i n : FLUME_HOME/bin: FLUMEHOME/bin:PATH
**注意:**具体目录,需要看你自己到底将其解压到的什么地方,完全照抄可能配置不好
# Flume环境变量 export FLUME_HOME=/opt/server/flume export PATH=$FLUME_HOME/bin:$PATH
-
配置完系统环境变量,务必每次更新 /etc/profile 文件
source /etc/profile
五、检测安装是否成功
flume-ng version
如图显示结果,则安装成功!
注意问题:可能提示权限不够!
我们需要进入 bin 目录下,为 flume-ng 赋执行权限
cd /opt/server/flume/bin/
chmod +x flume-ng
这样即可正常运行指令
Flume安装完毕!
如果有疑问或者文章有错误,请提出,我会在第一时间给出建议和修改。