《Kafka》3-Kafka的分区机制

最新推荐文章于 2024-05-30 14:39:31 发布

David_lou

最新推荐文章于 2024-05-30 14:39:31 发布

阅读量233

点赞数

分类专栏： Kafka 文章标签：生产者分区复杂均衡轮询 key分区

本文链接：https://blog.csdn.net/David_lou/article/details/109055323

版权

本文探讨了Kafka的分区机制，强调了分区在数据存储系统中的重要性，如提供可扩展性和消息有序性。Kafka生产者通过负载均衡策略将消息发送到不同分区，包括轮询、随机和根据key的分区策略。通过定制分区策略，如按IP归属地或车牌号，可以进一步优化数据分布和消费顺序。

摘要由CSDN通过智能技术生成

有讲到分区机制了，我发现只要是数据存储系统，都会涉及到分区的概念。例如mysql的分表/redis的分区/kafka的分区。在概览这一节我们看到了Kafka的基本组件，在Broker里面可以有多个主题的消息存储单元。在存储单元内可以有多个分区。

生产者生成消息之后发送给Broker，但是怎么进行分区呢。分区又会带来什么优点呢？

Kafka是java语言开发的，在生产者端可以配置分区策略：

继承实现接口：org.apache.kafka.clients.producer.Partitioner

int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster);

List<PartitionInf

关注

专栏目录