Kafka的ack机制、去重机制(幂等性)、副本同步机制和rebalance机制

1.ack机制

request.required.acks参数表示的是生产者生产消息时,写入到副本的严格程度,决定了生产者如何在性能和可靠性之间做取舍

acks参数有三个值 :

  • acks为1时(默认),表示数据发送到Kafka后,经过leader成功接收消息的的确认,才算发送成功,如果leader宕机了,就会丢失数据。
  • acks为0时, 表示生产者将数据发送出去就不管了,不等待任何返回。这种情况下数据传输效率最高,但是数据可靠性最低,当 server挂掉的时候就会丢数据;
  • acks为-1/all时,表示生产者需要等待ISR中的所有follower都确认接收到数据后才算发送完成,这样数据不会丢失,因此可靠性最高,性能最低。

2.Kafka生产者的去重机制,即幂等性

幂等性就是执行多次操作与执行一次操作的影响是一致的

为了实现生产者的幂等性,引入了Producer IDSequence Number的概念:

  • PID(生产者的唯一编号),每个Producer初始化时都会被分配一个唯一的PID,对于用户而言是透明的
  • Sequence Number(针对消息的递增序列),针对每个生产者(producer)发送到指定主题分区的消息都会对应一个从0开始递增的SequenceNumber

在生产者生产消息到partition的过程中会将PID与Secquence Number一块发送,Kafka接收到消息之后,会将二者保存下来,如果ACK响应失败,出现retry,一条消息被多次发送,那么Kafka就会根据PID 与Secquence Number 判断是否保存消息;如果Kafka不具有幂等性,就有可能在partition中重复保存相同的消息

配置幂等性

  • props.put(“enable.idempotence”,true);

3.副本的同步机制

同步副本时,follower获取leader的LogStartOffest(起始位置)和LEO(下一条待写入的位置),与本地的进行比较,如果本地的LogStartOffest超出了leader的值,就把超出的数据删除掉在进行同步,如果本地的小于leader的,就直接同步。

4.rebalance机制

rebalance机制是Kafka中为了确保消费者组下所有消费者达成一致,共同分配所订阅的topic的每个分区的机制,是消费者组中的consumer与topic下的partition进行重新匹配的饿过程。

触发时机

  • 消费者组的consumer数发生变化时
  • 订阅的topic数发生变化时
  • 订阅的topic的分区数发生变化时
  • 消费者消费超时,一直没有提交offset发生变化时

不良影响

  • 发生rebalance时,消费者组下的所有消费者都会协调在一起共同参与,利用分配策略尽可能达到最公平的分配;在这个过程中 ,所有消费者都会停止工作,直到rebalance完成

避免方案

  • 尽量选在业务低峰期再去修改订阅的topic或者topic的分区;
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SONNIE在路上

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值