kafka log存储

最新推荐文章于 2024-09-07 12:36:13 发布

tutucute0000

最新推荐文章于 2024-09-07 12:36:13 发布

阅读量5.3k

点赞数

分类专栏： kafka

本文链接：https://blog.csdn.net/tutucute0000/article/details/53909351

版权

本文介绍了如何分析Kafka topic的数据量，通过查看Kafka日志目录中特定partition的数据文件和index文件，确定在一定时间范围内接收到的数据条数。通过文件的创建和修改时间可以计算出分区接收到的数据条数，并解释了index文件的结构，用于存储数据的偏移量映射。

摘要由CSDN通过智能技术生成

因为程序从kafka里某一个topic读取的数据量过大，所以想看看这topic一天共有多少数据量，到底是不是读取的api有问题。

登录到该topic某一个paritition所在的机器上，进入到kafka-logs目录下该topic-partition的子目录。子目录中存储的数据文件如下

-rw-r--r-- 1 root root     906048 12月 22 10:57 00000000000013128029.index
-rw-r--r-- 1 root root 1073741161 12月 22 10:57 00000000000013128029.log
-rw-r--r-- 1 root root    1360104 12月 25 21:00 00000000000013622079.index
-rw-r--r-- 1 root root 1073737654 12月 25 21:00 00000000000013622079.log
-rw-r--r-- 1 root root   10485760 12月 28 15:49 00000000000014923211.index
-rw-r--r-- 1 root root  993289158 12月 28 15:50 00000000000014923211.log

每一个index和log文件是一对，当log文件大到一定阀值后，就会生成一对新的index和log文件，文件名上的数字，就是这对log文件开始存储的offset。

以 00000000000013622079.log 为例，这个文件的创建时间就是其第一条数据的接收时间，修改时间就是最后一条数据接收时间

stat 00000000000014923211.log
  File: `0

最低0.47元/天解锁文章

tutucute0000

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录