Flume 实时监控目录下的多个追加文件

Exec source 适用于监控一个实时追加的文件,但不能保证数据不丢失;
Spooldir Source 能够保证数据不丢失,且能够实现断点续传,但延迟较高,不能实时监控; Taildir Source 既能够实现断点续传,又可以保证数据不丢失,还能够进行实时监控。

1)案例需求:使用 Flume 监听整个目录的实时追加文件,并上传至 HDFS
2)需求分析:
在这里插入图片描述
实现步骤:
1.创建配置文件 flume-taildir-hdfs.conf
创建一个文件
在这里插入图片描述
添加如下内容
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
2.启动监控文件夹命令
在这里插入图片描述
3. 向 files 文件夹中追加内容
在/opt/module/flume 目录下创建 files 文件夹
在这里插入图片描述
向 upload 文件夹中添加文件
在这里插入图片描述
4. 查看 HDFS 上的数据
在这里插入图片描述
Taildir 说明:
Taildir Source 维护了一个 json 格式的 position File,其会定期的往 position File 中更新每个文件读取到的最新的位置,因此能够实现断点续传。Position File 的格式如下:
注:Linux 中储存文件元数据的区域就叫做 inode,每个 inode 都有一个号码,操作系统 用 inode 号码来识别不同的文件,Unix/Linux 系统内部不使用文件名,而使用 inode 号码来识别文件。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值