kafka自定义分区

最新推荐文章于 2024-06-06 15:35:55 发布

程序猿郭鹏飞神奇经历

最新推荐文章于 2024-06-06 15:35:55 发布

阅读量698

点赞数

分类专栏： kafka 文章标签： kafka自定义分区 kafka partition

本文链接：https://blog.csdn.net/weixin_43947279/article/details/115008677

版权

默认的Kafka分区策略包括null键的随机分配和非空键的哈希映射。自定义分区策略可以解决数据乱序问题，提供更好的负载均衡。通过配置Maven仓库并设置属性，可以启用自定义分区器。

摘要由CSDN通过智能技术生成

默认的分区策略

1.如果键值为 null，并且使用了默认的分区器，那么记录将被随机地发送到主题内各个可用的分区上。分区器使用轮询（Round Robin）算法将消息均衡地分布到各个分区上。
2.如果键不为空，并且使用了默认的分区器，那么 Kafka 会对键取 hash 值然后根据散列值把消息映射到特定的分区上。这里的关键之处在于，同一个键总是被映射到同一个分区上，所以在进行映射时，我们会使用主题所有的分区，而不仅仅是可用的分区。这也意味着，如果写入数据的分区是不可用的，那么就会发生错误。但这种情况很少发生。

自定义分区

1.可以解决乱序问题
2.可以适当解决负载均衡问题

maven仓库：

        <dependency>
            <groupId>org.apache.kafka</groupId>
            <artifactId>kafka_2.13</artifactId>
            <version>2.7.0</version>
        </dependency>

自定义分区：

import org.apache.kafka.clients

最低0.47元/天解锁文章

程序猿郭鹏飞神奇经历

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kafka自定义分区

默认的分区策略1.如果键值为 null，并且使用了默认的分区器，那么记录将被随机地发送到主题内各个可用的分区上。分区器使用轮询（Round Robin）算法将消息均衡地分布到各个分区上。2.如果键不为空，并且使用了默认的分区器，那么 Kafka 会对键取 hash 值然后根据散列值把消息映射到特定的分区上。这里的关键之处在于，同一个键总是被映射到同一个分区上，所以在进行映射时，我们会使用主题所有的分区，而不仅仅是可用的分区。这也意味着，如果写入数据的分区是不可用的，那么就会发生错误。但这种情况很少发生。
复制链接

扫一扫

专栏目录