kafka是什么?简单易懂解说笔记,包括Kafka常考面试题

Kafka是什么?

Kafka是一个分布式基于发布、订阅模式的消息队列。
什么?不懂?没问题,我慢慢讲给你听

先了解一下kafka内容:
1、消息、生产者、消费者
2、主题、分区
3、broker、集群

1、为什么要使用kafka:因为如果不通过一个管道来传输消息时,生产者直接推送给消费者消息会导致推送,会很杂乱,消费者接收能力也有限,并且耦合性非常高,迁一而发动全身,而Kafka就是这样的一个管道邮箱角色,生产者把所有消息放进管道内,消费者需要时在从管道内读取

所以整个链分为生产者、消息、消费者

2、那么我怎么知道管道里哪个是我的消息呢:这就有主题topic了,相当于取个名字,消费者根据名字来拿去消息,同时每个主题还有多个分区,这些分区可以放在不同的机架上. 把消息放入主题下面的各个分区下,这里又分两种存放方式:1、生产者指定存入哪个分区 2、若没有指定则根据自带的分区器来划分(分区器则时根据标记键key在通过一个算法放入值value)

总结一下:一条消息就包括主题、分区、键、值

3、消费者如何读取数据:消费者时通过偏移量offset来读取数据的,比如消费者会说:请给我分区2下面的第4个消息。这第4就是偏移量了,所以偏移量就是位置,同时需要注意偏移量是唯一的,并且消费者只能按顺序读取,不能跨越1直接读到2.

4、broker:一台kafka服务器就是一个broker。一个集群由多个broker组成。一个broker可以容纳多个topic。接收消息和推送消息都是通过broker,保存在磁盘上,同时Kafka是由容灾机制的,所以它可以有相同的主题,不同的broker这么一个副本,当相同的主题一挂掉了,还有另一个副本来保证数据的可靠性

以上就是简单的了解什么是Kafka

Kafka面试题

1.Kafka中的ISR、AR又代表什么?
ISR:与leader保持同步的follower集合
AR:分区的所有副本

2.Kafka中的HW、LEO等分别代表什么?
LEO:没个副本的最后条消息的offset
HW:一个分区中所有副本最小的offset

3.Kafka中是怎么体现消息顺序性的?
每个分区内,每条消息都有一个offset,故只能保证分区内有序。

4.Kafka中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?
拦截器 -> 序列化器 -> 分区器

5.Kafka生产者客户端的整体结构是什么样子的?使用了几个线程来处理?分别是什么?

6.“消费组中的消费者个数如果超过topic的分区,那么就会有消费者消费不到数据”这句话是否正确?
正确

7.消费者提交消费位移时提交的是当前消费到的最新消息的offset还是offset+1?
offset+1

8.有哪些情形会造成重复消费?

9.那些情景会造成消息漏消费?
先提交offset,后消费,有可能造成数据的重复

10.当你使用kafka-topics.sh创建(删除)了一个topic之后,Kafka背后会执行什么逻辑?
1)会在zookeeper中的/brokers/topics节点下创建一个新的topic节点,如:/brokers/topics/first
2)触发Controller的监听程序
3)kafka Controller 负责topic的创建工作,并更新metadata cache

11.topic的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么?
可以增加
bin/kafka-topics.sh --zookeeper localhost:2181/kafka --alter --topic topic-config --partitions 3

12.topic的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么?
不可以减少,被删除的分区数据难以处理。

13.Kafka有内部的topic吗?如果有是什么?有什么所用?
__consumer_offsets,保存消费者offset

14.Kafka分区分配的概念?
一个topic多个分区,一个消费者组多个消费者,故需要将分区分配个消费者(roundrobin、range)

15.简述Kafka的日志目录结构?
每个分区对应一个文件夹,文件夹的命名为topic-0,topic-1,内部为.log和.index文件

16.如果我指定了一个offset,Kafka Controller怎么查找到对应的消息?

17.聊一聊Kafka Controller的作用?
负责管理集群broker的上下线,所有topic的分区副本分配和leader选举等工作。

18.Kafka中有那些地方需要选举?这些地方的选举策略又有哪些?
partition leader(ISR),controller(先到先得)

19.失效副本是指什么?有那些应对措施?
不能及时与leader同步,暂时踢出ISR,等其追上leader之后再重新加入

20.Kafka的那些设计让它有如此高的性能?
分区,顺序写磁盘,0-copy

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值