kafka生产者自定义partition分区规则

最新推荐文章于 2024-07-18 11:08:52 发布

智达教育‍

最新推荐文章于 2024-07-18 11:08:52 发布

阅读量2.8k

点赞数

分类专栏：队列之rabbitmq和kafka 文章标签： zookeeper kafka partition

本文链接：https://blog.csdn.net/qq_29235677/article/details/121634317

版权

队列之rabbitmq和kafka 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍如何在Kafka生产者中自定义分区规则，通过修改`CustomPartitioner`实现，当key为特定值时进入特定分区，否则采用默认Murmur2哈希。提供了详细的步骤和示例代码，包括设置partitioner.class属性并配置测试用例。

摘要由CSDN通过智能技术生成

场景说明

自定义方法

使用方法

场景说明

在使用Kafka的时候，我们经常需要在生产者自定义一下获取partition分区的规则。下面是简单的自定义规则。

自定义方法

在进行自定义的时候，我们可以先看看默认的分区规则

这个类是DefaultPartitioner，实现了Partitioner接口。

这里我们需要定义修改的是partition方法

        if (keyBytes == null) {
            return stickyPartitionCache.partition(topic, cluster);
        } 
        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        // hash the keyBytes to choose a partition
        return Utils.toPositive(Utils.murmur2(keyBytes)) % numPartitions;

默认的这个方法很简单我们只需模仿默认的实现即可，我这里设置的规则是必须传key

当key为xxx的时候，进入到0分区，否则按照默认的策略。

public class CustomPartitioner implements Partitioner {
    @Override
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        if (keyBytes == null) {
            throw new IllegalArgumentException("keyBytes不能为空");
        }
        if ("xxx".equals(key)) {
            return 0;
        }
        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        // hash the keyBytes to choose a partition
        return Utils.toPositive(Utils.murmur2(keyBytes)) % numPartitions;
    }

    @Override
    public void close() {

    }

    @Override
    public void configure(Map<String, ?> configs) {

    }
}

只需要重写partition方法即可。

在使用的时候设置partitioner.class属性并指定类，就能够使用自定义的分区规则了。

下面是一个test用例

使用方法

properties.put("partitioner.class", "cn.mystylefree.kafkademo.config.CustomPartitioner");

@SpringBootTest
public class KafkaProducerTest {
    private static final String TOPIC_NAME = "xdclass-sp-topic";
    private static final String TOPIC_NAME1 = "xdclass-sp-topic-v1";

    public static Properties getProperties() {
        Properties props = new Properties();

        props.put("bootstrap.servers", "端口:9092");
        //props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "112.74.55.160:9092");

        // 当producer向leader发送数据时，可以通过request.required.acks参数来设置数据可靠性的级别,分别是0, 1，all。
        props.put("acks", "all");
        //props.put(ProducerConfig.ACKS_CONFIG, "all");

        // 请求失败，生产者会自动重试，指定是0次，如果启用重试，则会有重复消息的可能性
        props.put("retries", 0);
        //props.put(ProducerConfig.RETRIES_CONFIG, 0);

        // 生产者缓存每个分区未发送的消息,缓存的大小是通过 batch.size 配置指定的，默认值是16KB
        props.put("batch.size", 16384);

        /**
         * 默认值就是0，消息是立刻发送的，
         * 即便batch.size缓冲空间还没有满
         * 如果想减少请求的数量，可以设置 linger.ms 大于0，即消息在缓冲区保留的时间，超过设置的值就会被提交到服务端
         * 通俗解释是，本该早就发出去的消息被迫至少等待了linger.ms时间，相对于这时间内积累了更多消息，批量发送减少请求
         * 如果batch被填满或者linger.ms达到上限，满足其中一个就会被发送
         */
        props.put("linger.ms", 10);

        /**
         * buffer.memory的用来约束Kafka
         * Producer能够使用的内存缓冲的大小的，默认值32MB。
         * 如果buffer.memory设置的太小，可能导致消息快速的写入内存缓冲里，但Sender线程来不及把消息发送到Kafka服务器
         * 会造成内存缓冲很快就被写满，而一旦被写满，就会阻塞用户线程，不让继续往Kafka写消息了
         * buffer.memory要大于batch.size，否则会报申请内存不#足的错误，不要超过物理内存，根据实际情况调整
         * 需要结合实际业务情况压测进行配置
         */
        props.put("buffer.memory", 33554432);

        /**
         * key的序列化器，将用户提供的 key和value对象ProducerRecord 进行序列化处理，key.serializer必须被设置，
         * 即使消息中没有指定key，序列化器必须是一个实
         org.apache.kafka.common.serialization.Serializer接口的类，
         * 将key序列化成字节数组。
         */
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        return props;
    }

     /**
     * 自定义分区策略
     */
    @Test
    public void testSendWithCustomPartition() {
        Properties properties = getProperties();
        properties.put("partitioner.class", "cn.mystylefree.kafkademo.config.CustomPartitioner");
        Producer<String, String> producer = new KafkaProducer<String, String>(properties);
        for (int i = 0; i < 10; i++) {
            Future<RecordMetadata> send = producer.send(new ProducerRecord<>(TOPIC_NAME1, "xxx", "xxx" + i), new Callback() {
                @Override
                public void onCompletion(RecordMetadata metadata, Exception exception) {
                    if (exception == null) {
                        System.err.println("消息发送成功！" + metadata.toString());
                    } else {
                        //异常记录
                        exception.printStackTrace();
                    }
                }
            });
        }
        producer.close();

    }

}

好嘞解决