flume笔记（一）之基础架构

最新推荐文章于 2024-01-18 14:56:45 发布

王博1999

最新推荐文章于 2024-01-18 14:56:45 发布

阅读量177

点赞数

分类专栏：大数据文章标签：大数据 flume

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44604159/article/details/105966531

版权

大数据专栏收录该内容

39 篇文章 1 订阅

订阅专栏

定义：Flume其实就是一个高可靠、高可用、海量数据传输的流式框架。

一.Flume基础架构

Agent：是一个JVM进程，它以事件的形式将数据从源头送至目的

Source：负责接收数据到Agent。并且处理各种类型、格式的日志数据，主要包括Avro Source、Exec Source、Spooling Directory Source、Netcat Source等。

Sink：不断地将Channel中的事件批量的移除，并将这些事件批量写入到存储或索引系统、或者发送到另一个Flume Agent。其主要包括 HDFS Sink、Logger Sink、Avro Sink、File Sink、Hbase Sink等。

Channel：它是位于Source和Sink之间的缓冲区，Channel可以支持Source和Sink运行速率不同。并且可以同时处理几个Source的写入和Sink的写出操作。线程也是比较安全的。

其主要包括Memory Channel 和 File Channel 以及 Kafka Channel。

★ Memory Channel 是内存中的队列。Memory Channel 在www.baidu.com不需要关心数据丢失的情景下适用。如果需要关心数据丢失，那么 Memory Channel 就不应该使用，因为程序死亡、机器宕机或者重启都会导致数据丢失。

★ File Channel 将所有事件写到磁盘。因此在程序关闭或机器宕机的情况下不会丢失数据。

Event：Flume基本数据的传输单元。Event由Header和Body组成。Header用于存放Event属性，Body用于存放Event数据。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
flume笔记（一）之基础架构

定义：Flume其实就是一个高可靠、高可用、海量数据传输的流式框架。一.Flume基础架构Agent：是一个JVM进程，它以事件的形式将数据从源头送至目的Source（数据源）：负责接收数据到Agent。并且处理各种类型、格式的日志数据，主要包括Avro Source、ExecSource、Spooling DirectorySource、Netcat Source等。Si...
复制链接

扫一扫

专栏目录

博客等级

码龄6年

70
原创

37
点赞

121
收藏

52
粉丝

关注

私信

热门文章

分类专栏

大数据 39篇
自学Java 30篇

最新评论

spark—SQL实战案例
DaVinCi805: 博主请问环境配置那里可以讲的详细一点吗，比如下载的软件、虚拟机等等
kafka—分区的分配和再平衡
这个热点不太热: 尚硅谷的？？？
spark—SQL实战案例
王博1999: 链接：https://pan.baidu.com/s/1pzIRj-IgOKlu9IoXp9pFMw 提取码：gk2b --来自百度网盘超级会员V1的分享
spark—SQL实战案例
王博1999: 链接：https://pan.baidu.com/s/1pzIRj-IgOKlu9IoXp9pFMw 提取码：gk2b --来自百度网盘超级会员V1的分享
spark—SQL实战案例
晴天￥: 评论区能找到数据吗？博主给的文件链接失效了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

王博1999 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。