Kafka>Kafka知识点总结

本文全面总结了Kafka的知识点,包括Kafka的角色、使用场景、优缺点、架构及其流程、分区和消费组关系、数据读写、副本机制、数据删除策略等。此外,还探讨了Kafka的高性能原因、数据有序性、Zookeeper的角色以及消费者再平衡等关键概念。
摘要由CSDN通过智能技术生成

文章目录

Kafka知识点总结

  • 1、Kafka生态系统四大角色,生产者(Producer)、kafka集群(Broker)、消费者(Consumer)、zookeeper
  • 2、每个消费者都必须属于一个消费组,一个组内的消费者可以多个。
  • 3、一个Topic可以有0到多个多个分区(Partition)
  • 4、一个分区可以有0到多个segment。
  • 5、每个segment可以有由一个log和一个index组成。
  • 6、被复制的分区叫做主副本(Leader),复制出来的叫做从副本(Follwer)
  • 7、生产者只往主副本写数据,消费者只在主副本拉取数据。
  • 8、从副本只做数据备份,不做数据读写。

【红色字体表示隐藏知识点】

  • 9、一个分区内的一条数据,只能被一个消费组内的一个消费者消费。
  • 10、消费者的最大并发度由topic的分区数量决定
  • 11、分区副本的数量必须小于等于broker的数量
  • 12、一个topic内的多个分区,每个分区只是所有数据的一部分。所有分区的数据累加到一起是这个topic的全部数据。
  • 13、zookeeper中记录了broker的id 、消费者消费数据的offset,消费者与partition的对应关系(ConsumerA—> Partition-0, ConsumerB—> Partition-1)
    在这里插入图片描述

1、什么是kafka

是一个分布式,分区的,多副本的,多订阅者的消息发布订阅系统。

2、kafka的使用场景

应用耦合、异步处理、限流削峰、消息驱动的系统

3、kafka优缺点

优点:

  • 可靠性强(分布式-分区-副本)
  • 扩展性强(可伸缩)
  • 性能高(数据读写)
  • 耐用性强(数据持久化)
  • 时效性强。

缺点:

  • 由于是批量发送,数据并非真正的实时。
  • 仅支持统一分区内消息有序,无法实现全局消息有序;
  • 有可能消息重复消费;
  • 依赖zookeeper进行元数据管理。

4、Kafka架构(流程)

生产者、kafka集群、消费者、zookeeper

5、Kafka架构(API)

生产者、消费者、StreamAPI、ConnectAPI

6、Topic内部有哪些组成?

每个Topic包含一个或者多个Partition,一个partition当中存在多个segment文件段,每个segment分为两部分,.log文件和.index文件。

7、分区和消费组内的消费者之间的关系有哪些情况?

Partition = 消费任务的并发度=刚刚好,每个任务读取一个partition数据
Partition > 消费任务的并发度=有部分消费任务读取多个分区的数据
Partition < 消费任务的并发度=有部分消费任务空闲(可以创建多于分区的消费者数量)

8、分区数、消费者与读取效率之间的关系

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值