Kafka分区与分组原理

最新推荐文章于 2024-08-19 12:15:11 发布

青龙悟空

最新推荐文章于 2024-08-19 12:15:11 发布

阅读量512

点赞数

分类专栏： kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39674417/article/details/113078630

版权

本文介绍了Kafka的分区存储结构，包括topic的partition逻辑分布，partition内的文件存储方式，segment文件的组成和命名规则，以及如何通过offset查找message。文章还探讨了Kafka的高效性保证，如顺序写入、水平扩展和删除策略，并强调了consumer group的offset管理和Kafka的无状态特性对其高吞吐率的影响。

摘要由CSDN通过智能技术生成

topic中partition存储分布

Topic在逻辑上可以被认为是一个queue。每条消费都必须指定它的topic，可以简单理解为必须指明把这条消息放进哪个queue里。为了使得 Kafka的吞吐率可以水平扩展，物理上把topic分成一个或多个partition，每个partition在物理上对应一个文件夹，该文件夹下存储这个partition的所有消息和索引文件。partiton命名规则为topic名称+有序序号，第一个partiton序号从0开始，序号最大值为partitions数量减1。

partition中文件存储方式

下面示意图形象说明了partition中文件存储方式:

每个partion(目录)相当于一个巨型文件被平均分配到多个大小相等segment(段)数据文件中，但每个段segment file消息数量不一定相等，下面会提到一消息数量的算法，因为每个segment的大小是一定的，但是每条消息的大小可能不相同，因此数量不同。
每个partiton只需要支持顺序读写就行了，segment文件生命周期由服务端配置参数决定，这样做的好处就是能快速删除无用文件，有效提高磁盘利用率。

partition中segment文件存储结构

前面提到了每个topic被分成了多个partition分布到各个broker上，而每个partition的文件夹中又又多个小文件组成。

segment file组成：由2大部分组成，分别为index file和data file，此2个文件一一对应，成对出现，后缀".index"和“.log”分别表示为segment索引文件、数据文件.

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。