Kafka>Kafka知识点总结

最新推荐文章于 2024-10-27 12:21:51 发布

BigMoM1573

最新推荐文章于 2024-10-27 12:21:51 发布

阅读量187

点赞数

分类专栏： Kafka 文章标签： kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44509920/article/details/105335659

版权

本文全面总结了Kafka的知识点，包括Kafka的角色、使用场景、优缺点、架构及其流程、分区和消费组关系、数据读写、副本机制、数据删除策略等。此外，还探讨了Kafka的高性能原因、数据有序性、Zookeeper的角色以及消费者再平衡等关键概念。

摘要由CSDN通过智能技术生成

文章目录

Kafka知识点总结

Kafka知识点总结

1、Kafka生态系统四大角色，生产者(Producer)、kafka集群(Broker)、消费者(Consumer)、zookeeper
2、每个消费者都必须属于一个消费组，一个组内的消费者可以多个。
3、一个Topic可以有0到多个多个分区（Partition）
4、一个分区可以有0到多个segment。
5、每个segment可以有由一个log和一个index组成。
6、被复制的分区叫做主副本（Leader）,复制出来的叫做从副本（Follwer）
7、生产者只往主副本写数据，消费者只在主副本拉取数据。
8、从副本只做数据备份，不做数据读写。

【红色字体表示隐藏知识点】

9、一个分区内的一条数据，只能被一个消费组内的一个消费者消费。
10、消费者的最大并发度由topic的分区数量决定
11、分区副本的数量必须小于等于broker的数量
12、一个topic内的多个分区，每个分区只是所有数据的一部分。所有分区的数据累加到一起是这个topic的全部数据。
13、zookeeper中记录了broker的id 、消费者消费数据的offset,消费者与partition的对应关系（ConsumerA—> Partition-0, ConsumerB—> Partition-1）

1、什么是kafka

是一个分布式，分区的，多副本的，多订阅者的消息发布订阅系统。

2、kafka的使用场景

应用耦合、异步处理、限流削峰、消息驱动的系统

3、kafka优缺点

优点：

可靠性强（分布式-分区-副本）
扩展性强（可伸缩）
性能高（数据读写）
耐用性强（数据持久化）
时效性强。

缺点：

由于是批量发送，数据并非真正的实时。
仅支持统一分区内消息有序，无法实现全局消息有序；
有可能消息重复消费；
依赖zookeeper进行元数据管理。

4、Kafka架构（流程）

生产者、kafka集群、消费者、zookeeper

5、Kafka架构（API）

生产者、消费者、StreamAPI、ConnectAPI

6、Topic内部有哪些组成？

每个Topic包含一个或者多个Partition，一个partition当中存在多个segment文件段，每个segment分为两部分，.log文件和.index文件。

7、分区和消费组内的消费者之间的关系有哪些情况？

Partition = 消费任务的并发度=刚刚好，每个任务读取一个partition数据
Partition > 消费任务的并发度=有部分消费任务读取多个分区的数据
Partition < 消费任务的并发度=有部分消费任务空闲(可以创建多于分区的消费者数量)

8、分区数、消费者与读取效率之间的关系

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。