Flume 学习笔记（二）Flume复制多发案例 | 配置多个Channel对于相对不同的单个Sink | 将本地日志文件内容采集到HDFS和另一个本地位置

「已注销」

已于 2022-03-20 21:24:56 修改

阅读量1.4k

点赞数 1

分类专栏：学习笔记文章标签： flume

于 2022-03-20 17:09:54 首次发布

本文链接：https://blog.csdn.net/Unirithe/article/details/123612103

版权

这篇博客介绍了如何使用Flume将本地日志文件复制到HDFS和另一个本地位置。内容包括Flume的Memory Channel和Avro Source的概念，以及配置Flume Agent的步骤，最后通过启动三个Agent并验证测试结果来确保数据成功传输。

摘要由CSDN通过智能技术生成

若发现文章有误，敬请指教，感谢

文章目录

运行环境

一、参考资料

二、案例介绍&准备知识

2.1 Flume Memory Chennel

2.2 Flume Avro Source

三、准备案例

3.1 配置 Flume

3.2 准备本地sink目录

四、测试

4.1 启动三个 Flume Agent

4.2 观察测试结果

运行环境

JDK8
Hadoop3.3.0 单节点亦可
Flume1.9
CentOS7

一、参考资料

视频链接
 Flume官方文档

二、案例介绍&准备知识

Flume官方的架构图：
在这里插入图片描述

flume本质上就是一个Agent，通过Source（数据源）、Channel（缓冲管道）、Sink（输出源）这么一套工序，将数据从一个地方移动到另一个地方，那么本次案例则通过这样的思想，实现多个Agent的通信，最终将数据从log日志文件分流到HDFS和另一个本地文件位置。（注：这里暂未涉及拦截器）
案例结构图：
在这里插入图片描述
以下内容将用 $FLUME_HOME 代指flume的根目录

2.1 Flume Memory Chennel

官方说明

在Flume里什么是Chennel ？

Channels are the repositories where the events are staged on a agent. Source adds the events and Sink removes it.
译：Channels 是在Agent存储的事件，Source添加事件，Sink删除事件，言简意赅就是缓冲通道