kafka-数据存储介绍

飞飞羽毛球

已于 2022-06-12 14:15:38 修改

阅读量306

点赞数

分类专栏： kafka 文章标签： kafka 分布式

于 2022-06-12 14:11:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22323251/article/details/125244288

版权

kafka 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1. 基本概念

topic的一个分区对应一个日志(Log), Log又被切分为多个LogSegment，可以防止Log过大的同时方便维护和清理。

Log在物理上是以文件夹的形式存储，LogSegment对应的是一个日志文件和两个索引文件，以及可能的其他文件。

向Log中写入数据是顺序写入的，只会向最后一个LogSegment中写入数据，当满足一定条件后，会向新的LogSegment中写入数据。

每一个LogSegment都有一个基准偏移量用来表示当前LogSegment第一条消息的offset

2. 索引文件

索引文件主要用来提高消息查找的速度。

a. 偏移量索引文件

用来建立消息偏移量（offset）和物理地址间的映射关系，方便快速定位消息的物理文件位置

b. 时间戳索引文件

根据时间戳查找对应的偏移量信息

c. 索引文件

索引文件是稀疏索引，每写入一定量数据后，才会在索引文件中增加一个索引

索引文件内的偏移量是单调递增的，查找偏移量时采用二分查找，如果偏移量不在索引文件中，则返回小于指定的偏移量的最大偏移量

3. kafka速度快的原因:

数据顺序写入、页缓存、零拷贝

飞飞羽毛球

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kafka-数据存储介绍

topic的一个分区对应一个日志(Log), Log又被切分为多个LogSegment，可以防止Log过大的同时方便维护和清理。Log在物理上是以文件夹的形式存储，LogSegment对应的是以个日志文件和两个索引文件，以及可能的其他文件。想Log中写入数据是顺序写入的，只会向最后一个LogSegment中写入数据，当满足一定条件后，会向新的LogSegment中写入数据。每一个LogSegment都有一个基准偏移量用来表示当前LogSegment第一条消息的offset索引文件主要用来提高消息查找的速度。
复制链接

扫一扫

专栏目录

飞飞羽毛球

博客等级

码龄10年

94
原创

15
点赞

53
收藏

6
粉丝

关注

私信

热门文章

分类专栏

golang 25篇
redis 18篇
mysql 12篇
kafka 3篇
java 3篇
springboot 3篇
hive 3篇
mybatis 1篇
es 4篇
剑指offser 1篇
web 5篇
thinkphp 1篇
ssm 1篇
leetcode 1篇
php 6篇
linux 4篇
nginx 1篇
yii 1篇

最新评论

java源码-String
爱发博客的嗯哼: [code=java] private final char t[]; public PloyParameter(){ this.t="avc".value; } [/code]
java源码-String
爱发博客的嗯哼: 为啥我自己定义的会报错
java源码-String
爱发博客的嗯哼: [code=java] private final char value[]; public String() { this.value = "".value; } [/code]
java源码-String
爱发博客的嗯哼: 为什么String.value能够自动转化为字符数组
gorm-简单使用(一)
二哈喇子！: 写得很详细看完受益匪浅支持博主😍😍我能获得博主的无限回访吗！！！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。