kafka的数据存储

最新推荐文章于 2024-01-19 22:14:43 发布

健鑫.

最新推荐文章于 2024-01-19 22:14:43 发布

阅读量293

点赞数

分类专栏： kafka 文章标签： kafka java 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62759952/article/details/128624579

版权

kafka 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

kafka的数据存储

分片和副本机制

解决单台服务器内存有限的情况，将数据分成多个partition存放在多个服务器上，每个服务器上的数据叫做一个分片

kafka中的消息以topic进行分类，生产者和消费者都是面向topic的。

topic是逻辑上的概念，partition是物理上的概念，每个partition对应一个log文件，log文件中存储的是producer生产的数据，producer生产的数据不断地追加到log文件的末尾，每条数据有自己的offset。消费者会记录消费到了哪个offset

副本机制解决了数据存储的高可用的问题

当数据只存储一份时，有丢失的风险，为了容错，将数据拷贝积分，保存到不同的机器上

文件存储机制

一个topic可以分成多个partition

一个partition可以分成多个segment

一个segment对应.log和.index两个文件当log文件达到1G后，形成一个新的文件 index是log文件的索引文件，为了提升log文件的效率文件名为存储的消息的起始偏移量

kafka进行多文件存储的原因

保证每个文件不过大，使读取效率提高
kafka只是临时存储文件，会定期删除定期文件。如果数据放置在一个文件中，需要对整个文件进行遍历，效率低下。分成多个文件之后，只需要看文件最后修改的时间即可

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
kafka的数据存储

解决单台服务器内存有限的情况，将数据分成多个partition存放在多个服务器上，每个服务器上的数据叫做一个分片kafka中的消息以topic进行分类，生产者和消费者都是面向topic的。topic是逻辑上的概念，partition是物理上的概念，每个partition对应一个log文件，log文件中存储的是producer生产的数据，producer生产的数据不断地追加到log文件的末尾，每条数据有自己的offset。消费者会记录消费到了哪个offset副本机制解决了数据存储的高可用的问题。
复制链接

扫一扫

专栏目录

健鑫. CSDN认证博客专家 CSDN认证企业博客

码龄3年

94: 原创

73万+: 周排名

3万+: 总排名

7万+: 访问

: 等级

1268: 积分

248: 粉丝

254: 获赞

87: 评论

337: 收藏

私信

关注

热门文章

分类专栏

个人经历
GFS论文解读 1篇
java并发编程 1篇
数据仓库 4篇
大数据组件 2篇
数据结构与算法 11篇
hive 9篇
Hadoop 12篇
java多线程 8篇
spark 16篇
kafka 5篇
scala 4篇
JVM 2篇
JAVA 11篇

最新评论

三分钟快速理解Flink 作业提交流程(包工头的工程之路)
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
三分钟快速理解Flink 作业提交流程(包工头的工程之路)
2401_84170337: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Superset的安装(亲测三遍，有效)
JasonWod: 引用「pip install dataclasses」为啥我装出来dataclasses是0.6的？
java并发-线程池
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615582852?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。
java并发-线程池
勾栏听曲_0: 非常细致的内容，支持

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

健鑫. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。