超全的Kafka知识点总结(建议收藏!)

最新推荐文章于 2024-07-16 07:13:40 发布

大数据梦想家

最新推荐文章于 2024-07-16 07:13:40 发布

阅读量1.4w

点赞数 88

分类专栏： Kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44318830/article/details/105072995

版权

本文深入探讨Kafka，涵盖其定义、使用场景、优缺点、架构及关键组件，如Topic、分区、副本、消费者组、数据传输事务、数据删除策略等。通过了解Kafka的高性能特性和数据保证机制，帮助读者掌握Kafka的核心知识。

摘要由CSDN通过智能技术生成

前段时间写了Kafka快速入门系列1-8，但苦于知识点非常繁琐，对于很多初级选手来说并不友好，因此博主又根据所学，整理了一份关于Kafka知识点总结，希望对大家的学习有所帮助(✪ω✪)

码字不易,先赞后看!
在这里插入图片描述

文章目录

1. 什么是Kafka

kafka是一个分布式，分区的，多副本的，多订阅者的消息发布订阅系统。

2. Kafka的使用场景

应用耦合、异步处理、限流削峰、消息驱动的系统。

3. Kafka优缺点

优点：

可靠性强（分布式-分区-副本）、扩展性强（可伸缩）、性能高（数据读写）、耐用性强（数据持久化）、时效性强。

缺点：

由于是批量发送，数据并非真正的实时。
仅支持统一分区内消息有序，无法实现全局消息有序；
有可能消息重复消费；
依赖zookeeper进行元数据管理。

4. Kafka架构（流程）

生产者、kafka集群、消费者、zookeeper

5. Kafka架构（API）

生产者、消费者、StreamAPI、ConnectAPI

6.Topic内部有哪些组成？

每个Topic包含一个或者多个Partition，一个partition当中存在多个segment文件段，每个segment分为两部分，.log文件和.index文件。

7.分区和消费组内的消费者之间的关系有哪些情况？

Partition = 消费任务的并发度=刚刚好，每个任务读取一个partition数据

Partition > 消费任务的并发度=有部分消费任务读取多个分区的数据

Partition < 消费任务的并发度=有部分消费任务空闲(可以创建多于分区的消费者数量)

8. 分区数、消费者与读取效率之间的关系

分区数越多，同一时间可以有越多的消费者来进行消费，消费数据的速度就会越快，提高消费的性能

9. 副本数与broker之间的关系

数据副本（包含本身）数一般情况下小于等于broker的个数

10. 什么是主/从副本

被复制的分区叫做主副本（Leader）,复制出来的叫做从副本（Follower）

11. 主/从复本的作用是什么

主副本负责数据的读写。
从副本只做数据备份，不做数据读写。

12. Isr是什么

ISR是一组与leaders完全同步的消息副本（包括leaders本身）。

最低0.47元/天解锁文章

大数据梦想家

关注

88
点赞
踩
284

收藏

觉得还不错? 一键收藏
打赏
35
评论
超全的Kafka知识点总结(建议收藏!)

        前段时间写了Kafka快速入门系列1-8，但苦于知识点非常繁琐，对于很多初级选手来说并不友好，因此博主又根据所学，整理了一份关于Kafka知识点总结，希望对大家的学习有所帮助(✪ω✪)        码字不易,先赞后看!...
复制链接

扫一扫

专栏目录

评论 35

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据梦想家 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。