Flume

最新推荐文章于 2024-08-04 17:34:05 发布

袁小七哟

最新推荐文章于 2024-08-04 17:34:05 发布

阅读量42

点赞数

文章标签： flume 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44240098/article/details/132458665

版权

Flume的初步理解

Flume是Cloudera提供的一个高可用、高可靠，分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构，灵活简单。

知识点插入-----：
-----流式：一条数据一条数据的处理
-----批量：一批数据一批数据的处理
-----离线：数据处理的延迟以小时，天为单位
-----实时：数据处理的延迟以毫秒为单位

Flume基础架构

在这里插入图片描述
Agent是一个JVM进程，主要分为三个部分：Source、Channel、Sink。
Source主要负责接收数据，可以处理各种类型、各种格式的日志数据。
Sink负责接收Channel中的事件且批量的删除他们，并将这些事件批量写入到存储或索引系统，或者发送给另一个Agent。
Channel位于Source和Sink中间的缓冲区。Channel允许Source和Sink传输的速度不一致；Channel是线程安全的，可以同时处理几个Source的写入和几个Sink的读取操作。

Channel的类型

Flume自带两种Channel：Memory Channel和File Channel
Memory Channel：是内存中的队列。但是会存在数据丢失的情况，在运行过程中一旦程序死亡、机器宕机或者重启都会导致数据丢失。
File Channel：将所有事件写到磁盘，不会在程序关闭或者机器宕机的情况下发生数据丢失。

Kafka Channel：主要是对接Kafka，使用Kafka Channel可以节省Sink组件也可以提升效率。Kafka的高吞吐量以及可以对数据进行分类也就是不同的topic，方便下一层的使用，可以有效的提高数据的复用减少数据的冗余。

Taildir Source

优点：断电续传、多目录、不会丢失数据
隐患：数据可能重复（情况：Taildir Source使用inode和文件的全路径一起识别同一个文件，所以修改文件名之后如果表达式也能匹配上，会再重新读取一份文件的数据）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flume

Flume知识点简略摘要
复制链接

扫一扫

袁小七哟 CSDN认证博客专家 CSDN认证企业博客

码龄6年

6: 原创

162万+: 周排名

93万+: 总排名

403: 访问

: 等级

60: 积分

2: 粉丝

0: 获赞

4: 评论

0: 收藏

私信

关注

热门文章

最新评论

Hadoop集群准备
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
Kafka
CSDN-Ada助手: 恭喜你写了第5篇博客！标题中的“Kafka”这个词引起了我的兴趣。你在这篇博客中肯定展示了对Kafka的深入研究和理解。持续创作是一种很棒的习惯，我鼓励你继续保持，并继续分享你的知识和见解。下一步，我建议你可以探索一些与Kafka相关的实际应用案例，或者深入分析Kafka在大数据领域中的优势和挑战。期待看到你的下一篇博客！
Hive的一些问题总结
CSDN-Ada助手: 恭喜作者完成第6篇博客！阅读您总结的“Hive的一些问题总结”让我受益匪浅。我很高兴看到您在持续创作方面的努力。对于下一步的创作建议，我想提议您可以进一步扩展您的主题，例如深入探讨Hive的解决方案或者分享一些实际应用案例。期待您未来更多精彩的博客！
琐碎知识点总结
CSDN-Ada助手: 恭喜您写下了第三篇博客！看到标题《琐碎知识点总结》，我不禁感到兴奋。您的总结能够帮助读者系统地了解琐碎的知识点，这对于我们这些渴望学习的人来说非常有价值。在下一步的创作中，或许您可以考虑将这些知识点与实际案例或个人经验相结合，以让读者更好地理解和应用这些知识。期待您在未来的文章中再次展现您深厚的知识储备和谦逊的态度！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。