Kafka工作流程和文件存储机制

最新推荐文章于 2023-09-15 21:12:25 发布

MelodyYN

最新推荐文章于 2023-09-15 21:12:25 发布

阅读量128

点赞数 1

分类专栏： # Kafka 文章标签： kafka 分布式 big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36593748/article/details/122244057

版权

Kafka 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Kafka架构

1、Kafka工作流程

在这里插入图片描述

Kafka中消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。

一个topic下的每一个分区都单独维护自己的offset，所以分发到不同分区中的数据是不同的数据。消费者的分区维护是一个消费者组一个主题的一个分区维护一个offset。

通俗点说：一个分区对应于一个消费者，消费者对应记录对应分区的offset，从而获取数据。

2、Kafka文件存储机制

在这里插入图片描述

topic、log、segment是逻辑上的概念，而partition、.log文件、.index文件是物理上的概念。

每个partition对应于一个log文件，该log文件中存储的就是producer生产的数据。Producer生产的数据会被不断追加到该log文件末端，且每条数据都有自己的offset。消费者组中的每个消费者，都会实时记录自己消费到了哪个offset，以便出错恢复时，从上次的位置继续消费。

由于生产者生产的消息会不断追加到log文件末尾，为防止log文件过大导致数据定位效率低下，Kafka采取了分片和索引机制，将每个partition分为多个segment。每个segment对应两个文件——“.index”文件和“.log”文件。这些文件位于一个文件夹下，该文件夹的命名规则为：topic名称+分区序号。

“.index”文件存储大量的索引信息，索引信息按照数组的逻辑排列，“.log”文件存储大量的数据，数据直接紧密排列，索引文件中的元数据指向对应数据文件中message的物理偏移地址。二分查找的方式迅速定位我们的offset 在哪里。

3、Zookeeper在Kafka中的作用

在这里插入图片描述

Kafka集群中有一个broker会被选举为Controller，负责管理集群broker的上下线，所有topic的分区副本分配和leader选举等工作。Controller的管理工作都是依赖于Zookeeper。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Kafka工作流程和文件存储机制

Kafka架构1、Kafka工作流程Kafka中消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。一个topic下的每一个分区都单独维护自己的offset，所以分发到不同分区中的数据是不同的数据。消费者的分区维护是一个消费者组一个主题的一个分区维护一个offset。通俗点说：一个分区对应于一个消费者，消费者对应记录对应分区的offset，从而获取数据。2、Kafka文件存储机制topic、log、segment是逻辑上的概念，而partition、.log文
复制链接

扫一扫

专栏目录

MelodyYN CSDN认证博客专家 CSDN认证企业博客

码龄8年

177: 原创

2万+: 周排名

1万+: 总排名

14万+: 访问

: 等级

2172: 积分

2482: 粉丝

332: 获赞

39: 评论

559: 收藏

私信

关注

热门文章

分类专栏

数据结构与算法 7篇
Java 41篇
Scala 2篇
Python 8篇
计算引擎 1篇
Hive 11篇
Spark 5篇
Flink 1篇
数据库
MYSQL 3篇
ClickHouse 2篇
Redis
数据集成
DataX 4篇
Maxwell 1篇
Flume 4篇
Kafka 6篇
Linux 8篇
Docker 12篇
Hadoop 29篇
HBase 11篇
Zookeeper 4篇
工具类 5篇
Maven 2篇
粗糙集 13篇
笔记 1篇

最新评论

10.Docker Compose容器编排
程序员何未来: 10.Docker Compose容器编排，三连支持好文章
10.Docker Compose容器编排
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619015061。
8.Docker微服务实战
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/618801716。
8.Docker微服务实战
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618714549。
DataX数据迁移问题记录：字段中存在\n导致数据混乱
obsession5788: 很有用解决了我的问题～

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MelodyYN 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。