kafka工作机制以及文件存储机制

最新推荐文章于 2024-05-17 00:15:00 发布

_Ordinary丶

最新推荐文章于 2024-05-17 00:15:00 发布

阅读量100

点赞数

文章标签： kafka

本文链接：https://blog.csdn.net/qq_42533287/article/details/113486144

版权

kafka架构深入：

在这里插入图片描述

kafka中的消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。
topic是逻辑上的概念，而partition是物理上的概念，每个partition对应于一个log文件，该log 文件储存的就是producer生产的数据。producer生产的数据会不断地追加到文件末尾，且每条数据都有自己的offset。消费者组中的每个消费者，都会实时记录自己消费到了哪个offset，以便出错恢复时，从上次的位置继续消费。

总结：以文件形式存储
以大文件形式存储

kafka的文件储存机制

在这里插入图片描述
由于生产者生产的消息会不断地追加到这个log文件末尾，为了防止文件过大导致数据定位效率低下，kafka采用了分片和索引机制。将多个partition分为多个segment。
每一个segment对应两个文件——“.index”文件和“.log”文件。
这些文件位于一个文件夹下，该文件夹的命名规则为：topic名称+分区序号。例如，first这个topic有三个分区，则其对应的文件夹为first-0,first-1,first-2。

00000000000000000000.index
00000000000000000000.log
00000000000000170410.index
00000000000000170410.log
00000000000000239430.index
00000000000000239430.log

index和log文件以当前segment的第一条消息的offset命名。
“.index”文件存储大量的索引信息，“.log”文件存储大量的数据，索引文件中的元数据指向对应数据文件中message的物理偏移地址。

_Ordinary丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kafka工作机制以及文件存储机制

kafka架构深入：kafka中的消息是以topic进行分类的，生产者生产消息，消费者消费消息，都是面向topic的。topic是逻辑上的概念，而partition是物理上的概念，每个partition对应于一个log文件，该log 文件储存的就是producer生产的数据。producer生产的数据会不断地追加到文件末尾，且每条数据都有自己的offset。消费者组中的每个消费者，都会实时记录自己消费到了哪个offset，以便出错恢复时，从上次的位置继续消费。总结：以文件形式存储以大文件形式存储
复制链接

扫一扫