大数据之使用Flume监听端口采集数据流到Kafka

十二点的泡面

已于 2024-01-19 10:46:28 修改

阅读量3.1k

点赞数 47

分类专栏： Flume 大数据文章标签： flume

于 2024-01-05 21:16:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_78038072/article/details/135418173

版权

本文详细介绍了如何使用Flume监听25001端口，从实时数据生成器收集数据，并将这些数据存储到Kafka的ods_mall_log主题中。首先配置Flume Agent，包括Source（netcat）、Sink（KafkaSink）和Channel（内存）。接着创建Kafka的ods_mall_log Topic，启动Flume代理并执行数据生成脚本。最后通过Kafka消费者消费并查看前2条数据。

摘要由CSDN通过智能技术生成

本文介绍Flume监听端口采集数据流到Kafka

我还写了一篇文章是Flume监听本地文件采集数据流到HDFS【点击即可跳转，写的也非常详细】

任务一：实时数据采集

前摘：

Flume

是一种分布式、高可靠、高可用的数据收集系统，用于高效地从多个源收集、聚合和传输大量日志数据。
Flume的设计目标是用于构建高度可扩展的日志收集解决方案，它能够从多种数据源中捕获数据，并将数据送到指定的目的地，例如HDFS或Kafka。
Flume的核心是由agent组成的，每个agent内部包含三个主要的组件：source、channel和sink。

Source组件负责从数据源捕获数据

sink则负责将数据写入到最终的目标存储中，如HDFS或Kafka。

Channel组件作为临时存储，用于缓冲source和sink之间的数据

重点：因为source的收集速度和sink的存储速度不一样

kafka

是一个分布式消息系统，主要用于处理和传输大规模数据流。
具有高吞吐、可持久化、可水平扩展等特点，非常适合大数据实时处理领域。
Kafka不仅能够作为消息队列使用，提供消息的传输和存储功能，还能作为流式处理平台的源头，为诸如Storm、Spark Streaming等流式处理框架提供稳定的数据来源。
Kafka中的数据以主题（Topic）为单位进行归类。生产者（Producer）负责创建消息并将其发送到特定的主题。消费者（Consumer）则从主题订阅并接收消息进行进一步的处理。

最低0.47元/天解锁文章

十二点的泡面

关注

47
点赞
踩
47

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

十二点的泡面 CSDN认证博客专家 CSDN认证企业博客

码龄1年

68: 原创

1万+: 周排名

5万+: 总排名

8万+: 访问

: 等级

2068: 积分

2729: 粉丝

1357: 获赞

16: 评论

1166: 收藏

私信

关注

热门文章

分类专栏

大数据 27篇
Vue3 8篇
搭建 11篇
Hudi 1篇
大数据报错信息的解决 4篇
挖掘 4篇
scala 2篇
JavaScript 1篇
Linux
redis 6篇
Flink 12篇
算子 3篇
免费ssh工具分享 1篇
Flume 2篇

最新评论

Hudi最强指南 — Hudi的安装部署（Linux）
十二点的泡面: 你的版本对应上了吗，spark之类的
Hudi最强指南 — Hudi的安装部署（Linux）
Yu-kino: 你好我那个hudi-utilities_2.12一直失败，拒绝连接该怎么办
Vue的学习 —— ＜vue指令＞
秋说: 博主你好，感觉你的文章质量很好，这边有一个合作，可以私信我或添加我文章底部联系方式哈~
数据挖掘篇【 alias方法和隐式转换】
普通网友: 学到了！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
大数据学习之Flink算子、了解DataStream API（基础篇一）
CSDN-Ada助手: 恭喜您写了第20篇博客！标题看起来非常吸引人，对于想学习Flink算子和了解DataStream API的读者来说，一定非常有价值。我很佩服您坚持创作的毅力和对大数据学习的热情。对于下一步的创作建议，我谦虚地提出一些建议供您参考。首先，您可以进一步深入探讨Flink算子的应用场景和实际案例，这将帮助读者更好地理解算子的使用方法。其次，可以考虑介绍一些高级的DataStream API用法，比如窗口操作、状态管理等，这将使您的博客更加全面。再次祝贺您，期待您未来更多精彩的创作！

最新文章

2024

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。