CC00045.hadoop——|Hadoop&Flume.V08|——|Flume.v08|Flume.v1.9案例.v06|

本文介绍了使用Flume监控并采集日志文件,将其数据传输到HDFS和本地文件系统的详细步骤,重点在于Flume在大数据处理中的应用。
摘要由CSDN通过智能技术生成
一、监控日志文件采集数据到HDFS、本地文件系统
### --- 监控日志文件采集数据到HDFS、本地文件系统

~~~     # 业务需求:
~~~     监控日志文件,收集信息上传到HDFS 和 本地文件系统
### --- 需求分析:

~~~     需要多个Agent级联实现
~~~     source 选择 taildir
~~~     channel 选择 memory
~~~     最终的 sink 分别选择 hdfs、file_roll
~~~     # taildir Source。

~~~     Flume 1.7.0加入的新Source,相当于 spooldir source + execsource。
~~~     可以监控多个目录,并且使用正则表达式匹配该目录中的文件名进行实时收集。
~~~     实时监控一批文件,并记录每个文件最新消费位置,agent进程重启后不会有数据丢失的问题。
~~~     目前不适用于Windows系统;其不会对于跟踪的文件有任何处理,
~~~     不会重命名也不会删除,不会做任何修改。
~~~     不支持读取二进制文件,支持一行一行的读取文本文件。
二、实现步骤:
### --- 创建第一个配置文件flume-taildir-avro.conf 配置文件包括:

~~~     1个 taildir source
~~~     2个 memory channel
~~~     2个 avro sink
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yanqi_vip

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值