Flume之实时监控目录下的多个追加文件

本文介绍了如何使用 Flume 监听多个实时追加文件,并实现断点续传。通过创建配置文件 `flume-taildir-hdfs.conf`,监控 `taildir` 目录下的 `file1.txt` 和 `file2.txt`,并将数据上传到 HDFS。当Flume停止后再启动,仍能从上次采集的位置继续,避免数据丢失。
摘要由CSDN通过智能技术生成

1.实时监控目录下的多个追加文件

​ Exec source适用于监控一个实时追加的文件,不能实现断点续传;Spooldir Source适合用于同步新

文件,但不适合对实时追加日志的文件进行监听并同步;而Taildir Source适合用于监听多个实时追加

的文件,并且能够实现断点续传

1)案例需求:使用Flume监听整个目录的实时追加文件,并上传至HDFS

2)需求分析:

(1)创建符合条件的flume配置文件

(2)执行配置文件,开启监控

(3)向监控文件追加内容

​ echo 1111 >> taildir/file1.txt

​ echo 2222 >> taildir/file2.txt

(4)查看HDFS上的数据

3)实现步骤

(1)创建配置文件flume-taildir-hdfs.conf

创建一个文件

[xiao @hadoop102 datas]$ vim flume-taildir-hdfs.conf

添加如下内容

a1.sources = r1		#定义source
a1.sinks = k1		#定义sink
a1.channels = c1	#定义channel

# Describe/configure the source
a1.sources.r1.type = TAILDIR		#定义source类型
a1.sources.r1.positionFile = /opt/module/flume-1.9.0/datas/position/position.json
a1.sources.r1.filegroups = f1 f2		#指定position_file位置
a1.sources.r1.filegroups.f1 = /opt/module/flume-1.9.0/datas/taildir/file1.txt
a1.sources.r1.filegroups.f2 = /opt/module/flume-1.9.0/datas/taildir/file2.txt
#a1
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值