Kafka消费组核心API与核心参数运行机制剖析,面向Java开发者的复习指南

1.1 基础功能参数
  • group.id

消费组名称。

  • client.id

客户端标识id,默认为consumer-序号,在实践中建议包含客户端IP,在一个消费组中不能重复

  • bootstrap.servers

broker服务端地址列表。

  • client.dns.lookup

客户端寻找bootstrap地址的方式,支持如下两种方式:

  • resolve_canonical_bootstrap_servers_only

这种方式,会依据bootstrap.servers提供的主机名(hostname),根据主机上的名称服务返回其IP地址的数组(InetAddress.getAllByName),然后依次获取inetAddress.getCanonicalHostName(),再建立tcp连接。

一个主机可配置多个网卡,如果启用该功能,应该可以有效利用多网卡的优势,降低Broker的网络端负载压力

  • use_all_dns_ips

这种方式会直接使用bootstrap.servers中提供的hostname、port创建tcp连接,默认选项。

  • enable.auto.commit

是否开启自动位点提交,默认为true。

  • auto.commit.interval.ms

如果开启自动位点提交,位点的提交频率,默认为5s。

  • partition.assignment.strategy

消费端队列负载算法,默认为按区间平均分配(RangeAssignor),可选值:轮询(RoundRobinAssignor)

  • auto.offset.reset

重置位点策略,但kafka提交位点时,对应的消息已被删除时采取的恢复策略,默认为latest,可选:earliest、none(会抛出异常)。

  • key.deserializer

使用的key序列化类

  • value.deserializer

消息体序列化类

  • interceptor.classes

消费端拦截器,可以有多个。

  • check.crcs

在消费端时是否需要校验CRC,默认为true。

1.2 网络相关参数
  • send.buffer.bytes

网络通道(TCP)的发送缓存区大小,默认为128K。

  • receive.buffer.bytes

网络通道(TCP)的接收缓存区大小,默认为32K。

  • reconnect.backoff.ms

重新建立链接的等待时长,默认为50ms,属于底层网络参数,基本无需关注。

  • reconnect.backoff.max.ms

重新建立链接的最大等待时长,默认为1s,连续两次对同一个连接建立重连,等待时间会在reconnect.backoff.ms的初始值上成指数级递增,但超过max后,将不再指数级递增。

  • retry.backoff.ms

重试间隔时间,默认为100ms。

  • connections.max.idle.ms

连接的最大空闲时间,默认为9s。

  • request.timeout.ms

请求的超时时间,与Broker端的网络通讯的请求超时时间

1.3 核心工作参数
  • max.poll.records

每一次poll方法调用拉取的最大消息条数,默认为500。

  • max.poll.interval.ms

两次poll方法调用的最大间隔时间,单位毫秒,默认为5分钟。如果消费端在该间隔内没有发起poll操作,该消费者将被剔除,触发重平衡,将该消费者分配的队列分配给其他消费者

  • session.timeout.ms

消费者与broker的心跳超时时间,默认10s,broker在指定时间内没有收到心跳请求,broker端将会将该消费者移出,并触发重平衡

  • heartbeat.interval.ms

心跳间隔时间,消费者会以该频率向broker发送心跳,默认为3s,主要是确保session不会失效。

  • fetch.min.bytes

一次拉取消息最小返回的字节数量,默认为1字节。

  • fetch.max.bytes

一次拉取消息

《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》

【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】 完整内容开源分享

最大返回的字节数量,默认为1M,如果一个分区的第一批消息大小大于该值也会返回。

  • max.partition.fetch.bytes

一次拉取每一个分区最大拉取字节数,默认为1M。

  • fetch.max.wait.ms

fetch等待拉取数据符合fetch.min.bytes的最大等待时间。

  • metadata.max.age.ms

元数据在客户端的过期时间,过期后客户端会向broker重新拉取最新的元数据,默认为5分钟。

  • internal.leave.group.on.close

消费者关闭后是否立即离开订阅组,默认为true,即当客户端断开后立即触发重平衡。如果设置为false,则不会立即触发重平衡,而是要等session过期后才会触发。

2、KafkaConsumer核心组件与API


通过KafkaConsumer核心参数,我们基本可以窥探Kafka中的核心要点,接下来再介绍一下KafkaConsumer的核心组件,为后续深入研究Kafka消费者消费模型打下基础。

2.1 核心组件

在这里插入图片描述

KafkaConsumer由如下几个核心组件构成:

  • ConsumerNetworkClient

消费端网络客户端,服务底层网络通讯,负责客户端与服务端的RPC通信。

  • ConsumerCoordinator

消费端协调器,在Kafka的设计中,每一个消费组在集群中会选举一个broker节点成为该消费组的协调器,负责消费组状态的状态管理,尤其是消费组重平衡(消费者的加入与退出),该类就是消费者与broker协调器进行交互。

  • Fetcher

消息拉取。

温馨提示:本文不打算对每一个组件进行详细解读,这里建议大家按照本文第一部分关于各个参数的含义,然后对照这些参数最终是传resume递给哪些组件,进行一个关联思考。

2.2 核心API概述

最后我们再来看一下消费者的核心API。

在这里插入图片描述

  • Set< TopicPartition> assignment()

获取该消费者的队列分配列表。

  • Set< String> subscription()

获取该消费者的订阅信息。

  • void subscribe(Collection< String> topics)

订阅主题。

  • void subscribe(Collection< String> topics, ConsumerRebalanceListener callback)

订阅主题,并指定队列重平衡的监听器。

  • void assign(Collection< TopicPartition> partitions)

取代 subscription,手动指定消费哪些队列。

  • void unsubscribe()

取消订阅关系。

  • ConsumerRecords<K, V> poll(Duration timeout)

拉取消息,是 KafkaConsumer 的核心方法,将在下文详细介绍。

  • void commitSync()

同步提交消费进度,为本批次的消费提交,将在后续文章中详细介绍。

  • void commitSync(Duration timeout)

同步提交消费进度,可设置超时时间。

  • void commitSync(Map<TopicPartition, OffsetAndMetadata> offsets)

显示同步提交消费进度, offsets 指明需要提交消费进度的信息。

  • void commitSync(final Map<TopicPartition, OffsetAndMetadata> offsets, final Duration timeout)

显示同步提交消费进度,带超时间。

  • void seek(TopicPartition partition, long offset)

重置 consumer#poll 方法下一次拉消息的偏移量。

  • void seek(TopicPartition partition, OffsetAndMetadata offsetAndMetadata)

seek 方法重载方法。

  • void seekToBeginning(Collection< TopicPartition> partitions)

将 poll 方法下一次的拉取偏移量设置为队列的初始偏移量。

  • void seekToEnd(Collection< TopicPartition> partitions)

将 poll 方法下一次的拉取偏移量设置为队列的最大偏移量。

  • long position(TopicPartition partition)

获取将被拉取的偏移量。

  • long position(TopicPartition partition, final Duration timeout)

同上。

  • OffsetAndMetadata committed(TopicPartition partition)

获取指定分区已提交的偏移量。

  • OffsetAndMetadata committed(TopicPartition partition, final Duration timeout)

同上。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值