十二、kafka消费者之joinGroup-深入理解篇

小飞侠fly

已于 2022-07-21 22:26:25 修改

阅读量2.9k

点赞数 2

分类专栏： kafka 文章标签： kafka java 分布式

于 2022-02-08 09:00:00 首次发布

本文链接：https://blog.csdn.net/qq_34306010/article/details/122815579

版权

kafka 专栏收录该内容

15 篇文章 4 订阅

订阅专栏

主要是kafka消费者的joinGroup这里的重点内容太多了，一篇也讲不完，所以再开一篇从几个方面来深入分析。

group状态转换

从上一篇我们知道针对consumeGroup也有好几种状态，分别是PreparingRebalance，CompletingRebalance，Stable，Dead，Empty
kafka总结的各个状态可以执行的操作及状态流转如图一

PreparingRebalance：准备重平衡

心跳检测
同步group信息
收到leaveGroupRequest
等待group成员加入
允许提交offset
允许offsetFetchRequest

Stable：稳定态

心跳检测
支持处理syncGroup
允许follower重新加入组
允许offsetFetchRequest

CompletingRebalance：等待消费组leader分区分配

支持心跳检测
支持提交位移
暂停其他followers的同步组request
允许offsetFetchRequest

Empty：初始态，没有成员

正常返回给joinGroup请求
返回给syncGroup请求unknown_member_id
返回给heartbeat请求unknown_member_id
返回给leaveGroup请求unknown_member_id
返回给offsetCommit请求unknown_member_id
允许offsetFetchRequest

Dead：组中没有成员且metadata被移除

返回给joinGroup请求unknown_member_id
返回给syncGroup请求unknown_member_id
返回给heartbeat请求unknown_member_id
返回给leaveGroup请求unknown_member_id
返回给offsetCommit请求unknown_member_id
允许offsetFetchRequest

group延时处理

kafka中实现延时操作的类为DelayedOperation，在joinGroup请求处理中的延时操作在prepareRebalance方法中，代码如下，可以看到这里有个判断，如果group是Empty
态，则使用InitialDelayedJoin，否则使用DelayedJoin。group在什么时候会处于empty态呢？在组成员都离开组或者组创建的时候会处于这个状态。这也说明了kafka
针对组初始化时及组成员掉线或者退出之后再重平衡会有不同的处理。

 private def prepareRebalance(group: GroupMetadata, reason: String): Unit = {
    // if any members are awaiting sync, cancel their request and have them rejoin
    if (group.is(CompletingRebalance))
      resetAndPropagateAssignmentError(group, Errors.REBALANCE_IN_PROGRESS)
    info(s"rebalanceTimeout:${group.rebalanceTimeoutMs}---config:${groupConfig.groupInitialRebalanceDelayMs}")
    val delayedRebalance = if (group.is(Empty))
      new InitialDelayedJoin(this,
        joinPurgatory,
        group,
        groupConfig.groupInitialRebalanceDelayMs,
        groupConfig.groupInitialRebalanceDelayMs,
        max(group.rebalanceTimeoutMs - groupConfig.groupInitialRebalanceDelayMs, 0))
    else
      new DelayedJoin(this, group, group.rebalanceTimeoutMs)

    group.transitionTo(PreparingRebalance)

    info(s"Preparing to rebalance group ${group.groupId} in state ${group.currentState} with old generation " +
      s"${group.generationId} (${Topic.GROUP_METADATA_TOPIC_NAME}-${partitionFor(group.groupId)}) (reason: $reason)")
    //开启延时监控
    val groupKey = GroupKey(group.groupId)
    joinPurgatory.tryCompleteElseWatch(delayedRebalance, Seq(groupKey))
  }

我们先说明一下DelayedJoin中三个方法的作用，tryComplete是延时操作中给出的可以中途结束延时操作的方法，支持在某种情况下提前完成延时操作，onExpiration是指到截止时间后的处理，onComplete
表示完成时的处理，可手动完成或者延时处理到截止时间时完成。
我们来对比一下两种延时操作有什么不一样的？首先在prepareRebalance代码中可以看到两者初始化的参数不一样，然后InitialDelayedJoin是继承DelayedJoin的，且还复写了tryComplete
及onComplete方法。下面我们就从这三个方面来分析不同之处，深入理解为什么要这样处理。

private[group] class InitialDelayedJoin(coordinator: GroupCoordinator,
                                        purgatory: DelayedOperationPurgatory[DelayedJoin],
                                        group: GroupMetadata,
                                        configuredRebalanceDelay: Int,
                                        delayMs: Int,
                                        remainingMs: Int) extends DelayedJoin(coordinator, group, delayMs) {
  override def tryComplete(): Boolean = false

  override def onComplete(): Unit = {
    group.inLock {
      if (group.newMemberAdded && remainingMs != 0) {
        group.newMemberAdded = false
        val delay = min(configuredRebalanceDelay, remainingMs)
        val remaining = max(remainingMs - delayMs, 0)
        purgatory.tryCompleteElseWatch(new InitialDelayedJoin(coordinator,
          purgatory,
          group,
          configuredRebalanceDelay,
          delay,
          remaining
        ), Seq(GroupKey(group.groupId)))
      } else
        super.onComplete()
    }
  }
}

private[group] class DelayedJoin(coordinator: GroupCoordinator,
                                 group: GroupMetadata,
                                 rebalanceTimeout: Long) extends DelayedOperation(rebalanceTimeout, Some(group.lock)) {
  override def tryComplete(): Boolean = coordinator.tryCompleteJoin(group, forceComplete _)
  override def onExpiration() = coordinator.onExpireJoin()
  override def onComplete() = coordinator.onCompleteJoin(group)
}

初始化参数不一样

groupConfig.groupInitialRebalanceDelayMs为服务端group.initial.rebalance.delay.ms参数，默认是3000ms。
group.rebalanceTimeoutMs如果是consume客户端的话对应max.poll.interval.ms配置，默认是300000ms，即五分钟。

InitialDelayedJoin中有几个参数需要重点关注一下，第一个groupConfig.groupInitialRebalanceDelayMs表示配置的时间，第二个groupConfig
.groupInitialRebalanceDelayMs表示延时的时间，max(group.rebalanceTimeoutMs - groupConfig.groupInitialRebalanceDelayMs, 0))
表示还剩余的时间，可以看到剩余时间是用客户端的group.rebalanceTimeoutMs减去服务端的groupInitialRebalanceDelayMs。

 new InitialDelayedJoin(this,
        joinPurgatory,
        group,
        groupConfig.groupInitialRebalanceDelayMs,
        groupConfig.groupInitialRebalanceDelayMs,
        max(group.rebalanceTimeoutMs - groupConfig.groupInitialRebalanceDelayMs, 0))
 new DelayedJoin(this, group, group.rebalanceTimeoutMs)

tryComplete方法：

在InitialDelayedJoin中总是为false，也就是不支持提前完成，而在DelayedJoin中代码如下，如果判定所有成员都加入的话就可提前完成延时操作

 def tryCompleteJoin(group: GroupMetadata, forceComplete: () => Boolean) = {
    group.inLock {
      if (group.hasAllMembersJoined)
        forceComplete()
      else false
    }
  }

判断提前完成延时操作的代码如下，即判定成员的个数等于待加入的成员个数（members及numMembersAwaitingJoin都会在添加或者updateMember的时候更新）
且pendingMembers为空，pendingMembers在没有memberId且不是静态成员的时候第一次加入组请求会被记录在这个list里面

  def hasAllMembersJoined: Boolean ={
    members.size == numMembersAwaitingJoin && pendingMembers.isEmpty
  }

onComplete方法：

在 InitialDelayedJoin中会判断如果是首次加入组且还有剩余的时间，则会再次发起InitialDelayedJoin延时，否则直接调用DelayedJoin中的onComplete
完成延时操作，从这里来看，我们其实也可以把groupConfig.groupInitialRebalanceDelayMs配置的稍微长一些，比如配置个10000ms，减少组初次加入时rebalance的次数。


override def onComplete(): Unit = {
    group.inLock {
      if (group.newMemberAdded && remainingMs != 0) {
        group.newMemberAdded = false
        val delay = min(configuredRebalanceDelay, remainingMs)
        val remaining = max(remainingMs - delayMs, 0)
        purgatory.tryCompleteElseWatch(new InitialDelayedJoin(coordinator,
          purgatory,
          group,
          configuredRebalanceDelay,
          delay,
          remaining
        ), Seq(GroupKey(group.groupId)))
      } else
        super.onComplete()
    }
  }

总结

group初始化时的延时时间使用的是groupConfig.groupInitialRebalanceDelayMs，默认是3000ms即3秒，也就是说3秒内没有新的成员加入就会触发rebalance，如果有新成员操作，继续延时3
秒，直到超过group.rebalanceTimeoutMs的时间
如果中途触发重平衡操作，则使用DelayedJoin，超时时间使用的是group.rebalanceTimeoutMs，默认为5分钟，看着时间很长，实际上会多次调用tryComplete去尝试完成操作，直到超过5分钟。
比如中间加入了一个消费者，首先会发起加入组的请求，然后使group变成PreparingRebalance态，并等待原有成员重新发起加入组请求，待到最后一个成员加入之后会满足tryComplete条件，然后提前触发rebalance。

groupInstanceId原理分析

官方给出的说法是配置groupInstanceId后会有更长的超时时间，减少rebalance的次数。今天我们就来仔细分析是如何实现的。
在上一节的源码分析中我们知道kafka对于 groupInstanceId的处理无非就以下两种
1、无memberId时生成memberId，然后将memberId与groupInstanceId的关系记录在staticMembers(HashMap)
中，如果原先已有memberId，则生成新的memberId并更新与groupInstanceId的关系
2、存在memberId时，则跟不配置groupInstanceId的消费者一样处理，调用updateMemberAndRebalance方法
综上，针对groupInstanceId实际就多了一层 staticMembers的映射关系，为什么要这么做呢，首先memberId是kafka服务端针对消费者设置的唯一id，在消费者接入时会由服务端来分配这个id，id
会记在消费者的内存中，一旦消费者重启则会丢失id，则需要向服务端重新请求加入组，我们知道在这种情况下，消费者会请求两次，第一次用空的memberId去请求服务端获取memberId，第二次再带有这个memberId
去请求加入组。如果我们配置了groupInstanceId，kafka服务端就会在首次请求时记录这个groupInstanceId与memberId
的关系，无需消费者再次带着memberId请求，不仅会在首次加入组时减少一次网络请求，还会在中途客户端重启的情况下，在限定的时间内重新加入组时，只更新staticMembers的关系，而不发起rebalance
，从而减少了消费者集群rebalance的次数，这种性能提升无疑是很必要的。

针对设置groupInstanceId中途客户端重启的case，这里单独拿demo来演示一下。

针对消费组rebalance有两个重要的参数需要注意
1、session.timeout.ms 消费者离开组的最大时间间隔，如果我们平常消费者重启需要10分钟左右，则可设置为10分钟，在10分钟以内且带有groupInstanceId的消费者重新接入组，集群不会发生rebalance,
这里还有一点，session.timeout.ms 的取值需要在服务端的group.min.session.timeout.ms，group.max.session.timeout.ms范围内，两边都可等。
2、max.poll.interval.ms 两次poll的最大时间间隔，若超过这个时间间隔还未发起poll操作，则消费组认为该消费组已离开了消费组，将进行再均衡操作，max.poll.interval
.ms参数在请求加入组时会作为rebalance_timeout_ms的值，而group的rebalanceTimeoutMs则是取当前还存在的member的最大rebalanceTimeoutMs，这一点也很重要。这块代码如下：

  //kafka.coordinator.group.GroupMetadata#rebalanceTimeoutMs
  def rebalanceTimeoutMs = members.values.foldLeft(0) { (timeout, member) =>
    timeout.max(member.rebalanceTimeoutMs)
  }

demo1

准备topic_1,设置三个分区0,1,2
准备消费者：
消费者1：设置groupInstanceId，session.timeout.ms设置为360000(6分钟),max.poll.interval.ms设置为120000(2分钟)
消费者2：不设置groupInstanceId，session.timeout.ms设置为10000(10秒),max.poll.interval.ms设置为60000(1分钟)
消费者3：设置groupInstanceId，session.timeout.ms设置为180000(3分钟),max.poll.interval.ms设置为180000(3分钟)
操作：启动消费者1,2,3，待分配完成后停掉1跟3，日志如下

//1、消费者1、2、3都启动成功
[data-plane-kafka-request-handler-7] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]:
Stabilized group mykafka-group_4 generation 22 (__consumer_offsets-37)–2022-02-05 15:54:47
[data-plane-kafka-request-handler-3] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Assignment received from leader for group mykafka-group_4 for generation 22
//2、率先发现消费者3已离开，发起rebalance
[executor-Heartbeat] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Member mykafka-group_4_3-6086fe20-5371-4c5d-a818-91936cffbc16 in group mykafka-group_4 has failed, removing it from the group
[executor-Heartbeat] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Preparing to rebalance group mykafka-group_4 in state PreparingRebalance with old generation 22 (__consumer_offsets-37) (reason: removing member mykafka-group_4_3-6086fe20-5371-4c5d-a818-91936cffbc16 on heartbeat expiration)
[executor-Heartbeat] INFO kafka.server.DelayedOperationPurgatory - tryCompleteElseWatch----------start------2022-02-05 15:57:56
[executor-Heartbeat] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—0—
[executor-Heartbeat] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—0—
[executor-Heartbeat] INFO kafka.server.DelayedOperationPurgatory - operation—delayMs:120000
[data-plane-kafka-request-handler-4] INFO kafka.server.KafkaApis - [KafkaApi-1] receive joinGroupRequest: {group_id=mykafka-group_4,session_timeout_ms=10000,rebalance_timeout_ms=60000,member_id=mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a,group_instance_id=null,protocol_type=consumer,protocols=[{name=sticky,metadata=java.nio.HeapByteBuffer[pos=0 lim=48 cap=48],_tagged_fields={}}],_tagged_fields={}}
[data-plane-kafka-request-handler-4] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—1—
[data-plane-kafka-request-handler-4] INFO kafka.server.KafkaApis - [KafkaApi-1] receive joinGroupRequest: {group_id=mykafka-group_4,session_timeout_ms=10000,rebalance_timeout_ms=60000,member_id=mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a,group_instance_id=null,protocol_type=consumer,protocols=[{name=sticky,metadata=java.nio.HeapByteBuffer[pos=0 lim=48 cap=48],_tagged_fields={}}],_tagged_fields={}}
[data-plane-kafka-request-handler-4] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—1—
//3、rebalance超时时间为2分钟，2分钟之后结束rebalance
[executor-Rebalance] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Stabilized group mykafka-group_4 generation 23 (__consumer_offsets-37)–2022-02-05 15:59:56
[data-plane-kafka-request-handler-3] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Assignment received from leader for group mykafka-group_4 for generation 23

最终分配结果如下:

[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] (Re-)joining group
[main] INFO org.apache.kafka.clients.consumer.internals.ConsumerCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Joining group with current subscription: [topic_1]
[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Sending JoinGroup request:JoinGroupRequestData(groupId=‘mykafka-group_4’, sessionTimeoutMs=10000, rebalanceTimeoutMs=60000, memberId=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, groupInstanceId=null, protocolType=‘consumer’, protocols=[JoinGroupRequestProtocol(name=‘sticky’, metadata=[0, 1, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 25, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 22, 0, 0, 0, 0])])
[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Received successful JoinGroup response: JoinGroupResponseData(throttleTimeMs=0, errorCode=0, generationId=23, protocolType=‘consumer’, protocolName=‘sticky’, leader=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, memberId=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, members=[JoinGroupResponseMember(memberId=‘mykafka-group_4_1-a16c0f93-1b71-44cf-b527-32bf8ab7a6e1’, groupInstanceId=‘mykafka-group_4_1’, metadata=[0, 1, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 25, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 21, 0, 0, 0, 0]), JoinGroupResponseMember(memberId=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, groupInstanceId=null, metadata=[0, 1, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 25, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 22, 0, 0, 0, 0])])
[main] INFO org.apache.kafka.clients.consumer.internals.ConsumerCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Finished assignment for group at generation 23: {mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a=Assignment(partitions=[topic_1-2, topic_1-1]), mykafka-group_4_1-a16c0f93-1b71-44cf-b527-32bf8ab7a6e1=Assignment(partitions=[topic_1-0])}
[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Successfully joined group with generation 23
[main] INFO org.apache.kafka.clients.consumer.internals.ConsumerCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Adding newly assigned partitions: topic_1-2, topic_1-1

日志分析：
这里的日志很有意思，首先是在54分的时候消费者1,2,3都启动分配成功，这个时候关闭了消费者1,3，因为消费者3设置的session.timeout
.ms为3分钟，到57分的时候发现消费者3离组，发起rebalance，剩下两个member，最大的session.timeout
.ms是消费者1的120000，所以delayMs为120000，两分钟之后也只有一个消费者2加入组，到了超时时间，所以开始分配消费的分区，可以在第二块日志中看到最后的结果：{mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a=Assignment(partitions=[topic_1-2, topic_1-1]), mykafka-group_4_1-a16c0f93-1b71-44cf-b527-32bf8ab7a6e1=Assignment(partitions=[topic_1-0])}
消费者2分配了两个分区，而消费者1分配了一个分区，虽然消费者1已离线，系统还是会默认在线然后分配分区。
那什么时候服务端会判定消费者1也离线呢？经过测试得知是在上一次rebalance结束后开始计算，一直到消费者1设置的session.timeout.ms(6分钟)
后，即在16:06:00左右发现消费者1离线，然后再次发起rebalance，将三个分区都分配给消费者2.

demo2

准备topic_1,设置三个分区0,1,2
准备消费者：
消费者1：不设置groupInstanceId，session.timeout.ms设置为360000(6分钟),max.poll.interval.ms设置为120000(2分钟)
消费者2：不设置groupInstanceId，session.timeout.ms设置为10000(10秒),max.poll.interval.ms设置为60000(1分钟)
消费者3：不设置groupInstanceId，session.timeout.ms设置为180000(3分钟),max.poll.interval.ms设置为180000(3分钟)
操作：启动消费者1,2,3，待分配完成后停掉1跟3，日志如下

//1、消费者1、2、3都启动成功
[data-plane-kafka-request-handler-7] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Stabilized group mykafka-group_4 generation 26 (__consumer_offsets-37)–2022-02-05 16:18:53
[data-plane-kafka-request-handler-3] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Assignment received from leader for group mykafka-group_4 for generation 26
//2、率先发现消费者3已离开，发起rebalance
[executor-Heartbeat] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Member mykafka-group_4_3-42965fb6-3f33-4929-a6d6-c5eb961e743a in group mykafka-group_4 has failed, removing it from the group
[executor-Heartbeat] INFO kafka.coordinator.group.GroupMetadata - member----mykafka-group_4_1-b84d78ec-7a88-4d4b-ad6e-e1df6c5f8769—120000
[executor-Heartbeat] INFO kafka.coordinator.group.GroupMetadata - member----mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a—60000
[executor-Heartbeat] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Preparing to rebalance group mykafka-group_4 in state PreparingRebalance with old generation 26 (__consumer_offsets-37) (reason: removing member mykafka-group_4_3-42965fb6-3f33-4929-a6d6-c5eb961e743a on heartbeat expiration)
[executor-Heartbeat] INFO kafka.server.DelayedOperationPurgatory - tryCompleteElseWatch----------start------2022-02-05 16:22:26
[executor-Heartbeat] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—0—
[executor-Heartbeat] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—0—
[executor-Heartbeat] INFO kafka.server.DelayedOperationPurgatory - operation—delayMs:120000
[data-plane-kafka-request-handler-6] INFO kafka.server.KafkaApis - [KafkaApi-1] receive joinGroupRequest: {group_id=mykafka-group_4,session_timeout_ms=10000,rebalance_timeout_ms=60000,member_id=mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a,group_instance_id=null,protocol_type=consumer,protocols=[{name=sticky,metadata=java.nio.HeapByteBuffer[pos=0 lim=48 cap=48],_tagged_fields={}}],_tagged_fields={}}
[data-plane-kafka-request-handler-6] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—1—
[data-plane-kafka-request-handler-0] INFO kafka.server.KafkaApis - [KafkaApi-1] receive joinGroupRequest: {group_id=mykafka-group_4,session_timeout_ms=10000,rebalance_timeout_ms=60000,member_id=mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a,group_instance_id=null,protocol_type=consumer,protocols=[{name=sticky,metadata=java.nio.HeapByteBuffer[pos=0 lim=48 cap=48],_tagged_fields={}}],_tagged_fields={}}
[data-plane-kafka-request-handler-0] INFO kafka.coordinator.group.GroupMetadata - hasAllMembersJoined----2—1—
//3、rebalance超时时间为2分钟，2分钟之后结束rebalance
[executor-Rebalance] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Stabilized group mykafka-group_4 generation 27 (__consumer_offsets-37)–2022-02-05 16:24:26
[data-plane-kafka-request-handler-3] INFO kafka.coordinator.group.GroupCoordinator - [GroupCoordinator 1]: Assignment received from leader for group mykafka-group_4 for generation 27

最终分配结果如下：

[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] (Re-)joining group
[main] INFO org.apache.kafka.clients.consumer.internals.ConsumerCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Joining group with current subscription: [topic_1]
[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Sending JoinGroup request:JoinGroupRequestData(groupId=‘mykafka-group_4’, sessionTimeoutMs=10000, rebalanceTimeoutMs=60000, memberId=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, groupInstanceId=null, protocolType=‘consumer’, protocols=[JoinGroupRequestProtocol(name=‘sticky’, metadata=[0, 1, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 25, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 26, 0, 0, 0, 0])])
[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Received successful JoinGroup response: JoinGroupResponseData(throttleTimeMs=0, errorCode=0, generationId=27, protocolType=‘consumer’, protocolName=‘sticky’, leader=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, memberId=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, members=[JoinGroupResponseMember(memberId=‘mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a’, groupInstanceId=null, metadata=[0, 1, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 25, 0, 0, 0, 1, 0, 7, 116, 111, 112, 105, 99, 95, 49, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 26, 0, 0, 0, 0])])
[main] INFO org.apache.kafka.clients.consumer.internals.ConsumerCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Finished assignment for group at generation 27: {mykafka-group_4_2-529ff7e3-87bd-4984-9dbe-e8afe7d1e12a=Assignment(partitions=[topic_1-2, topic_1-0, topic_1-1])}
[main] INFO org.apache.kafka.clients.consumer.internals.AbstractCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Successfully joined group with generation 27
[main] INFO org.apache.kafka.clients.consumer.internals.ConsumerCoordinator - [Consumer clientId=mykafka-group_4_2, groupId=mykafka-group_4] Adding newly assigned partitions: topic_1-2, topic_1-1, topic_1-0

日志分析：
这个demo与上一个不同的是没有设置groupInstanceId，可以看到在停掉消费者1,
3之后第一次rebalance就给消费者2分配了三个分区，与设置groupInstanceId想比较，配置了groupInstanceId还是有更长的超时时间。

小飞侠fly

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
十二、kafka消费者之joinGroup-深入理解篇

主要是kafka消费者的joinGroup这里的重点内容太多了，一篇也讲不完，所以再开一篇从几个方面来深入分析。group状态转换从上一篇我们知道针对consumeGroup也有好几种状态，分别是PreparingRebalance，CompletingRebalance，Stable，Dead，Emptykafka总结的各个状态可以执行的操作及状态流转如图一PreparingRebalance：准备重平衡心跳检测同步group信息收到leaveGroupRequest等待group成员
复制链接

扫一扫