Flume安装及使用

最新推荐文章于 2022-06-16 19:43:00 发布

972579

最新推荐文章于 2022-06-16 19:43:00 发布

阅读量187

点赞数

分类专栏：大数据文章标签：日志采集系统

本文链接：https://blog.csdn.net/qq_33184697/article/details/78710467

版权

大数据专栏收录该内容

6 篇文章 0 订阅

订阅专栏

FLume安装

1.Flume结构图

1.简单结构

单个agent采集数据

2.复杂结构
多级agent之间串联

2.Flume运行机制

1、 Flume分布式系统中最核心的角色是agent，flume采集系统就是由一个个agent所连接起来形成

2、每一个agent相当于一个数据传递员，内部有三个组件：

a) Source：采集源，用于跟数据源对接，以获取数据

b) Sink：下沉地，采集数据的传送目的，用于往下一级agent传递数据或者往最终存储系统传递数据

c) Channel：angent内部的数据传输通道，用于从source将数据传递到sink

3.Flume的安装部署

1、Flume的安装非常简单，只需要解压即可，当然，前提是已有hadoop环境

上传安装包到数据源所在节点上

然后解压

tar -zxvf apache-flume-1.7.0-bin.tar.gz

然后进入flume的目录，修改conf下的flume-env.sh，在里面配置JAVA_HOME

2、根据数据采集的需求配置采集方案，描述在配置文件中(文件名可任意自定义)

3、指定采集方案配置文件，在相应的节点上启动flume agent

Flume使用案例

将实时的本地文件放入hdfs中

（1） vi hdfs_exec.conf

a1.sources = r1
a1.sinks = k1
a1.channels = c1

#exec 指的是命令
# Describe/configure the source
a1.sources.r1.type = exec
#F根据文件名追中, f根据文件的nodeid追中
a1.sources.r1.command = tail -F /home/hadoop/data/test.log
a1.sources.r1.channels = c1

# Describe the sink
#下沉目标
a1.sinks.k1.type = hdfs
a1.sinks.k1.channel = c1
#指定目录, flum帮做目的替换
a1.sinks.k1.hdfs.path = /flume/events/%y-%m-%d/%H%M/
#文件的命名, 前缀
a1.sinks.k1.hdfs.filePrefix = events-

#10 分钟就改目录
a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 5
a1.sinks.k1.hdfs.roundUnit = minute

#文件滚动之前的等待时间(秒)
a1.sinks.k1.hdfs.rollInterval = 5

#文件滚动的大小限制(bytes)
a1.sinks.k1.hdfs.rollSize = 500

#写入多少个event数据后滚动文件(事件个数)
a1.sinks.k1.hdfs.rollCount = 20

#5个事件就往里面写入
a1.sinks.k1.hdfs.batchSize = 5

#用本地时间格式化目录
a1.sinks.k1.hdfs.useLocalTimeStamp = true

#下沉后, 生成的文件类型，默认是Sequencefile，可用DataStream，则为普通文本
a1.sinks.k1.hdfs.fileType = DataStream

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

（2）启动agent,并将日志信息显示到控制台

bin/flume-ng agent -c conf -f conf/hdfs_exec.conf -n a1  -Dflume.root.logger=INFO,console

# -c conf   指定flume自身的配置文件所在目录
# -f conf/hdfs_exec.conf  指定我们所描述的采集方案
# -n a1  指定我们这个agent的名字

972579

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flume安装及使用

FLume安装1.Flume结构图1.简单结构2.复杂结构 2.Flume运行机制1、 Flume分布式系统中最核心的角色是agent，flume采集系统就是由一个个agent所连接起来形成2、每一个agent相当于一个数据传递员，内部有三个组件：a) Source：采集源，用于跟数据源对接，以获取数据b) Sink：下沉地，采集数据的传送目的，用于往下一级agent传递数据或
复制链接

扫一扫

专栏目录