Kafka分区路由之自定义分区

阿kent_1990

已于 2023-08-14 10:10:14 修改

阅读量359

点赞数

文章标签： kafka 分布式

于 2023-08-14 10:08:05 首次发布

本文链接：https://blog.csdn.net/weixin_38682092/article/details/132269694

版权

前言

在现代的分布式消息传递系统中，Apache Kafka凭借其高性能、高可靠性和出色的扩展性成为了行业的佼佼者。分区路由作为Kafka的关键特性之一，在构建高效消息传递系统时扮演着重要角色。本文将深入探讨为何需要分区路由，介绍几种常见的分区路由策略，并通过Spring Boot集成Kafka，演示如何发送指定消息到分区，以及消费者如何接收这些消息。

为何需要分区路由？

分区路由是Kafka实现高性能、高吞吐量消息传递的基础。它允许消息根据特定规则被分发到不同的分区，带来以下优势：

负载均衡：通过将消息均匀地分布到各个分区，避免了部分分区过载而影响整体性能。
并行处理：不同分区的消息可以并行处理，提升了系统的整体吞吐量。
消息顺序性：Kafka保证同一分区内的消息有序，但不同分区的消息可以同时处理，实现了顺序性与并行性的平衡。

几种分区路由的策略

Kafka提供了多种分区路由策略，开发者可以根据实际需求选择适合的策略：

默认策略：基于消息的key进行分区。相同key的消息将被分发到同一分区，确保具有相同key的消息在同一分区内有序。
随机策略：随机将消息分配到不同分区，实现简单的负载均衡。
自定义策略：开发者可以根据业务逻辑实现自定义的分区策略，例如根据特定字段的哈希值对分区数取模，实现特定的消息路由逻辑。

Spring Boot集成Kafka：发送指定消息到分区示例

以下是一个使用Spring Boot集成Kafka的示例，演示如何发送指定消息到特定分区，且使用了根据key的哈希值对分区数取模的策略：

首先，确保在pom.xml文件中添加Kafka依赖

<dependency>
    <groupId>org.springframework.kafka</groupId>
    <artifactId>spring-kafka</artifactId>
</dependency>

然后创建一个自定义的Partitioner，实现自定义分区策略

public class VehiclePartitioner implements Partitioner {
    @Override
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        if (key == null) {
            Random rand = new Random();
            return rand.nextInt(numPartitions);
        }
        return Math.abs(key.hashCode() % numPartitions);

    }

    @Override
    public void close() {

    }

    @Override
    public void configure(Map<String, ?> configs) {

    }
}

spring集成kakfa配置

spring:
  kafka:
    bootstrap-servers: #你具体的kafka集群地址
    #生产者
    producer: 
      retries: 0 # 重试次数
      acks: 1 # 应答级别:多少个分区副本备份完成时向生产者发送ack确认(可选0、1、all/-1)
      batch-size: 16384 # 批量大小
      buffer-memory: 33554432 # 生产端缓冲区大小
      key-serializer: org.apache.kafka.common.serialization.StringSerializer
      value-serializer: org.apache.kafka.common.serialization.StringSerializer
    #消费者
    consumer:
      auto:
        commit:
          interval:
            ms: 1000
      auto-offset-reset: latest
      enable-auto-commit: true
      key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
      properties:
        group:
          id: defaultConsumerGroup #消费者组
        request:
          timeout:
            ms: 180000
        session:
          timeout:
            ms: 120000
      value-deserializer: org.apache.kafka.common.serialization.StringDeserializer
    listener:
      missing-topics-fatal: false

创建生产者producer

@Component
public class DataProducer {
    @Autowired
    private KafkaTemplate kafkaTemplate;
    //对key指定分区发送消息
    public void sendMsg(String topic,String key,String msg){
        if(key !=null){
            kafkaTemplate.send(topic,key,msg);
        }
    }
    //默认策略发送消息
    public void sendMsg(String topic,String msg){
            kafkaTemplate.send(topic,msg);
    }
}

创建消费者consumer

@Component
@Slf4j
public class KafkaConsumer {

    // 消费监听
    @KafkaListener(topics = {"test-topic"})
    public void onMessage(ConsumerRecord<?,?> record){
        log.info("消费====>："+record.topic()+"-"+record.partition()+"-"+record.value());
    }
}

结论

Kafka分区路由是构建高性能、高可靠消息传递系统的核心机制之一。通过选择合适的分区路由策略，可以实现负载均衡、并行处理和消息顺序性。Spring Boot集成Kafka使得开发者可以更轻松地发送特定消息到特定分区，并通过消费者实时接收和处理这些消息。在实际应用中，开发者应根据业务需求灵活选择分区路由策略，以优化消息传递系统的性能和可靠性。