kafka 生产端指定分区和消费端分区指派

最新推荐文章于 2023-01-15 22:00:06 发布

yanerhao

最新推荐文章于 2023-01-15 22:00:06 发布

阅读量2.3k

点赞数 2

分类专栏： KAFKA

本文链接：https://blog.csdn.net/yanerhao/article/details/106215176

版权

KAFKA 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

生产端指定分区

主要依靠分配器，对于kafka默认分配器，主要工作流程：

1 如果消息自带key则对key可以hash然后选择目标分区；

2 如果消息无key则采用RoundRobin轮询算法，这样可以最大限度确保消息在所有分区的均匀性；

3 特别的，生产者API赋予用户自行指定分区的权利，在发送消息时如果指定了分区则可以跳过以上分区法则。

消费端分区指派

在 kafka 中，存在着两种为消费组组内的消费者分区的分配策略。一种是 RangeAssignor 分配策略(范围分区)，另一种是 RoundRobinAssignor分配策略(轮询分区)。默认采用 Range 范围分区。 Kafka提供了消费者客户端参数 partition.assignment.strategy 用来设置消费者与订阅主题之间的分区分配策略。

1.1 RangeAssignor 范围分区

Range 范围分区策略是对每个 topic 而言的。首先对同一个 topic 里面的分区按照序号进行排序，并对消费者按照字母顺序进行排序。假如现在有 10 个分区，3 个消费者，排序后的分区将会是0,1,2,3,4,5,6,7,8,9；消费者排序完之后将会是C1-0,C2-0,C3-0。通过 partitions数/consumer数来决定每个消费者应该消费几个分区。如果除不尽，那么前面几个消费者将会多消费 1 个分区。
C1-0 消费 0 1 2 3

C2-0 消费 3 5 6

C3-0 消费 7 8 9

Range 范围分区的弊端：

如上，只是针对 1 个 topic 而言，C1-0消费者多消费1个分区影响不是很大。如果有 N 多个 topic，那么针对每个 topic，消费者 C1-0 都将多消费 1 个分区，topic越多，C1-0 消费的分区会比其他消费者明显多消费 N 个分区。这就是 Range 范围分区的一个很明显的弊端了

.2 RoundRobinAssignor 轮询分区

RoundRobin 轮询分区策略，是把所有的 partition 和所有的 consumer 都列出来，然后按照 hascode 进行排序，最后通过轮询算法来分配 partition 给到各个消费者。

轮询分区分为如下两种情况：①同一消费组内所有消费者订阅的消息都是相同的 ②同一消费者组内的消费者订阅的消息不相同

①如果同一消费组内，所有的消费者订阅的消息都是相同的，那么 RoundRobin 策略的分区分配会是均匀的。

例如：同一消费者组中，有 3 个消费者C0、C1和C2，都订阅了 2 个主题 t0 和 t1，并且每个主题都有 3 个分区(p0、p1、p2)，那么所订阅的所以分区可以标识为t0p0、t0p1、t0p2、t1p0、t1p1、t1p2。最终分区分配结果如下：

消费者C0   消费 t0p0 、t1p0 分区
消费者C1   消费 t0p1 、t1p1 分区
消费者C2   消费 t0p2 、t1p2 分区
       ②如果同一消费者组内，所订阅的消息是不相同的，那么在执行分区分配的时候，就不是完全的轮询分配，有可能会导致分区分配的不均匀。如果某个消费者没有订阅消费组内的某个 topic，那么在分配分区的时候，此消费者将不会分配到这个 topic 的任何分区。

例如：同一消费者组中，有3个消费者C0、C1和C2，他们共订阅了 3 个主题（但每个订阅的不一样）：t0、t1 和 t2，这 3 个主题分别有 1、2、3 个分区(即:t0有1个分区(p0)，t1有2个分区(p0、p1)，t2有3个分区(p0、p1、p2))，即整个消费者所订阅的所有分区可以标识为 t0p0、t1p0、t1p1、t2p0、t2p1、t2p2。具体而言，消费者C0订阅的是主题t0，消费者C1订阅的是主题t0和t1，消费者C2订阅的是主题t0、t1和t2，最终分区分配结果如下：

消费者C0   消费 t0p0
消费者C1   消费 t1p0 分区
消费者C2   消费 t1p1、t2p0、t2p1、t2p2 分区

RoundRobin轮询分区的弊端：

从如上实例，可以看到RoundRobin策略也并不是时分完美，这样分配其实并不是最优解，因为完全可以将分区 t1p1 分配给消费者 C1。

所以，如果想要使用RoundRobin 轮询分区策略，必须满足如下条件：

①每个消费者订阅的主题，必须是相同的