Kafka -- 架构、分区、副本

新手小农

已于 2023-11-07 19:01:36 修改

阅读量754

点赞数

分类专栏： Kafka 2.11-1.0.0 文章标签： kafka 分布式

于 2023-11-07 17:09:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62078954/article/details/134266630

版权

Kafka 2.11-1.0.0 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1、Kafka的架构：

1、producer：消息的生产者

2、consumer：消息的消费者

3、broker：kafka集群的服务者，一个broker就是一个节点，主要是负责处理消息的读、写的请求和存储消息。在kafka cluster中包含很多的broker。

4、topic：消息的队列/分类，就类似一张表，里面用来接收数据，数据的格式可以随意，但是一般都会统一。

5、zookeeper：负责存储元数据。

2、kafka的分区和副本：

1、每一个topic可以分成多个partition，每一个分区一张表数据，在Kafka底层中就是一个以log结尾的文件，分别存在对应的data目录下（通过配置文件指定的）

使用分区的原因是实现分布式，一个topic中的数据非常大的时候，如果只存在一个分区那么数据压力就比较大。

2、每个partition内部消息强有序，其中的每个消息都有一个序号叫offset（消费偏移量），再取数据的时候就会根据这个偏移量来取数据

3、一个partition只对应一个broker，一个broker可以管多个partition

4、消息不经过内存缓冲，是直接写入磁盘中。

5、根据时间策略删除数据，并不是数据消费完成就删除数据。默认是7天删除一次数据，删除的一整个文件，默认是1G左右生成一个文件。对于存储的时间可以通过修改配置文件来决定存储的日期。

6、producer自己决定往哪个partition写消息，可以是轮询的负载均衡，或者是基于hash的partition策略

轮询的负载均衡：数据数循环的向每一partition中写，数据比较均衡

基于hash的partition策略：数据会根据hash值据欸的那个进入哪个partition，可以根据相同的key进入同一个partition中。但是可能会造成一个问题：数据倾斜的问题。

7、consumer（消费者）自己维护消费到哪个offset，每一个用户都记录自己所消费的offset，这些数据都是默认存在--toppic：__consumer_offsetsL中

8、每一个consumer都有对应的group，一个组中可以是一个用户，也可以是多个用户。

group内是queue消费模型

各个consumer消费不同的partition，因此一个消息在group内只消费一次，这样能保证消费数据不重复

group间是publish-subscribe消费模型

各个group各自独立消费，互不影响，因此一个消息在被每个group消费一次

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Kafka -- 架构、分区、副本

3、broker：kafka集群的服务者，一个broker就是一个节点，主要是负责处理消息的读、写的请求和存储消息。1、每一个topic可以分成多个partition，每一个分区一张表数据，在Kafka底层中就是一个以log结尾的文件，分别存在对应的data目录下（通过配置文件指定的）4、topic：消息的队列/分类，就类似一张表，里面用来接收数据，数据的格式可以随意，但是一般都会统一。使用分区的原因是实现分布式，一个topic中的数据非常大的时候，如果只存在一个分区那么数据压力就比较大。
复制链接

扫一扫

专栏目录

博客等级

码龄3年

91
原创

223
点赞

198
收藏

170
粉丝

关注

私信

热门文章

分类专栏

最新评论

大数据面试专题 -- kafka
普通网友: 写的真好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
python -- 容器
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Spark Core----Spark常用算子
简单简单小白: 讲解的很详细，很有参考价值
Scala使用的基本语法
CSDN-Ada助手: 恭喜你开始了博客创作！学习Scala的基本语法是一个很好的起点，希望你可以继续分享更多关于Scala的知识和经验。我建议你可以尝试写一些实际的代码示例，或者分享一些在实际项目中使用Scala的经验，这样可以让读者更加深入地了解这门语言。加油！期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Flink SQL -- 命令行的使用
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/617558402。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。