Flume简述:
(1)Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。
(2)Flume最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到HDFS。
(3)Flume用于将多种来源的日志以流的方式传输至Hadoop或者其它目的地。一种可靠、可用的高效分布式数据收集服务。
(4)Flume拥有基于数据流上的简单灵活架构,支持容错、故障转移与恢复。
Flume架构:
- Client:客户端,数据产生的地方,如Web服务器
- Event:事件,指通过Agent传输的单个数据包,如日志数据通常对应一行数据
- Agent:代理,一个独立的JVM进程
Flume以一个或多个Agent部署运行,Agent包含三个组件
Source、Channel、Sink
Flume安装前准备工作:
1、安装配置好jdk,如果不会安装可以跳转到脚本安装jdk保姆级教程
2、搭建配置好Hadoop,如果不会配置安装可以跳转到Hadoop配置保姆级教程
Flume安装步骤:
1、通过xftp将flume安装包上传到Linux中,版本是flume-ng-1.6.0-cdh5.14.0.tar.gz
2、解压缩tar -zxf flume-ng-1.6.0-cdh5.14.0.tar.gz -C ../soft/
3、为了方便以后使用,将解压缩后的文件夹修改名字mv apache-flume-1.6.0-cdh5.14.0-bin/ flume160
4、配置环境变量vim /etc/profile
#flume
export FLUME_HOME=/opt/soft/flume160
export PATH=$PATH:$FLUME_HOME/bin
5、配置flume.env.sh
首先先做个拷贝cp flume-env.sh.template flume-env.sh
,接着配置flume.env.sh
图中红框框所指的就是分配给内存的内存和最大内存,这个根据自己虚拟机所给内存大小来调节。
至此,flume安装配置完成了~