【Kafka面试】Kafka数据清理机制了解过吗？

最新推荐文章于 2024-07-15 21:35:51 发布

TAIKEMAN

最新推荐文章于 2024-07-15 21:35:51 发布

阅读量1.5k

点赞数

分类专栏： Kafka 文章标签： kafka

本文链接：https://blog.csdn.net/weixin_45574582/article/details/130653678

版权

10 篇文章 1 订阅

订阅专栏

在这里插入图片描述

Kafka生产者通过topic发送数据，topic只是一个逻辑概念，真正存储数据的位置是分区，分区在broker机器上对应的是文件夹（topic名称-分区号）
分区内部存储了数据文件，也是分段存储的。在一个分区下可能存在多个日志分区段（segment）
每个段都对应了3个文件：.index索引文件、.log真正的数据文件、.timeindex时间索引文件

删除无用文件（已经被消费过很长时间的文件）更方便，提高磁盘利用率
查找数据更便捷：如果消息量很大，全都存储在一个文件中，那么查找速度肯定会受限
文件命名都是以偏移量进行命名的：查找数据时，肯定是知道需要查找的偏移量的，此时可以快速定位到某个文件，通过.index索引文件，再去从.log文件中找出具体的数据

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注