SpringBoot整合kafka

最新推荐文章于 2024-07-13 00:30:00 发布

Drew晓

最新推荐文章于 2024-07-13 00:30:00 发布

阅读量915

点赞数 2

分类专栏： springBoot kafka

本文链接：https://blog.csdn.net/wjlzx/article/details/90442868

版权

springBoot 同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

kafka

4 篇文章 0 订阅

订阅专栏

1、搭建项目，在https://start.spring.io/网站中，添加kafka依赖，生成项目

2、在application.properties文件中添加kafka配置

#生产者
#kafka服务器地址
spring.kafka.producer.bootstrap-servers=xx.xx.xx.xx:9092,xx.xx.xx.xx:9091
#重发次数
spring.kafka.producer.retries=1
#批量提交大小
spring.kafka.producer.batch-size=16384
#缓存大小
spring.kafka.producer.buffer-memory=33554432
#最大请求消息体大小
spring.kafka.producer.properties.max.requst.size=2097152
#key序列化类
spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer
#value序列化类
spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer
#procedure要求leader在考虑完成请求之前收到的确认数，用于控制发送记录在服务端的持久化，其值可以为如下：
#acks = 0 如果设置为零，则生产者将不会等待来自服务器的任何确认，该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下，无法保证服务器已收到记录，并且重试配置将不会生效（因为客户端通常不会知道任何故障），为每条记录返回的偏移量始终设置为-1。
#acks = 1 这意味着leader会将记录写入其本地日志，但无需等待所有副本服务器的完全确认即可做出回应，在这种情况下，如果leader在确认记录后立即失败，但在将数据复制到所有的副本服务器之前，则记录将会丢失。
#acks = all 这意味着leader将等待完整的同步副本集以确认记录，这保证了只要至少一个同步副本服务器仍然存活，记录就不会丢失，这是最强有力的保证，这相当于acks = -1的设置。
spring.kafka.producer.acks=1
#消费者
#kafka服务器地址
spring.kafka.consumer.bootstrap-servers=xx.xx.xx.xx:9092,xx.xx.xx.xx:9091
#消费组id
spring.kafka.consumer.group-id=DrewGroup
# earliest:当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，从头开始消费
# latest:当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，消费新产生的该分区下的数据
# none:topic各分区都存在已提交的offset时，从offset后开始消费；只要有一个分区不存在已提交的offset，则抛出异常
spring.kafka.consumer.auto-offset-reset=earliest
#是否自动提交偏移量
spring.kafka.consumer.enable-auto-commit=true
#自动提交偏移量的频率
spring.kafka.consumer.auto-commit-interval=100
#消费线程数，即启动的客户端数
spring.kafka.listener.concurrency=2

部分参数配置如下（转自https://blog.csdn.net/fenglibing/article/details/82117166）

#################consumer的配置参数（开始）#################
#如果'enable.auto.commit'为true，则消费者偏移自动提交给Kafka的频率（以毫秒为单位），默认值为5000。
spring.kafka.consumer.auto-commit-interval;
 
#当Kafka中没有初始偏移量或者服务器上不再存在当前偏移量时该怎么办，默认值为latest，表示自动将偏移重置为最新的偏移量
#可选的值为latest, earliest, none
spring.kafka.consumer.auto-offset-reset=latest;
 
#以逗号分隔的主机：端口对列表，用于建立与Kafka群集的初始连接。
spring.kafka.consumer.bootstrap-servers;
 
#ID在发出请求时传递给服务器;用于服务器端日志记录。
spring.kafka.consumer.client-id;
 
#如果为true，则消费者的偏移量将在后台定期提交，默认值为true
spring.kafka.consumer.enable-auto-commit=true;
 
#如果没有足够的数据立即满足“fetch.min.bytes”给出的要求，服务器在回答获取请求之前将阻塞的最长时间（以毫秒为单位）
#默认值为500
spring.kafka.consumer.fetch-max-wait;
 
#服务器应以字节为单位返回获取请求的最小数据量，默认值为1，对应的kafka的参数为fetch.min.bytes。
spring.kafka.consumer.fetch-min-size;
 
#用于标识此使用者所属的使用者组的唯一字符串。
spring.kafka.consumer.group-id;
 
#心跳与消费者协调员之间的预期时间（以毫秒为单位），默认值为3000
spring.kafka.consumer.heartbeat-interval;
 
#密钥的反序列化器类，实现类实现了接口org.apache.kafka.common.serialization.Deserializer
spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.StringDeserializer
 
#值的反序列化器类，实现类实现了接口org.apache.kafka.common.serialization.Deserializer
spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer
 
#一次调用poll()操作时返回的最大记录数，默认值为500
spring.kafka.consumer.max-poll-records;
#################consumer的配置参数（结束）#################


#################producer的配置参数（开始）#################
#procedure要求leader在考虑完成请求之前收到的确认数，用于控制发送记录在服务端的持久化，其值可以为如下：
#acks = 0 如果设置为零，则生产者将不会等待来自服务器的任何确认，该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下，无法保证服务器已收到记录，并且重试配置将不会生效（因为客户端通常不会知道任何故障），为每条记录返回的偏移量始终设置为-1。
#acks = 1 这意味着leader会将记录写入其本地日志，但无需等待所有副本服务器的完全确认即可做出回应，在这种情况下，如果leader在确认记录后立即失败，但在将数据复制到所有的副本服务器之前，则记录将会丢失。
#acks = all 这意味着leader将等待完整的同步副本集以确认记录，这保证了只要至少一个同步副本服务器仍然存活，记录就不会丢失，这是最强有力的保证，这相当于acks = -1的设置。
spring.kafka.producer.acks=1
 
#每当多个记录被发送到同一分区时，生产者将尝试将记录一起批量处理为更少的请求， 
#这有助于提升客户端和服务器上的性能，此配置控制默认批量大小（以字节为单位），默认值为16384
spring.kafka.producer.batch-size=16384
 
#以逗号分隔的主机：端口对列表，用于建立与Kafka群集的初始连接
spring.kafka.producer.bootstrap-servers
 
#生产者可用于缓冲等待发送到服务器的记录的内存总字节数，默认值为33554432
spring.kafka.producer.buffer-memory=33554432
 
#ID在发出请求时传递给服务器，用于服务器端日志记录
spring.kafka.producer.client-id
 
#生产者生成的所有数据的压缩类型，此配置接受标准压缩编解码器（'gzip'，'snappy'，'lz4'），
#它还接受'uncompressed'以及'producer'，分别表示没有压缩以及保留生产者设置的原始压缩编解码器，
#默认值为producer
spring.kafka.producer.compression-type=producer
 
#key的Serializer类，实现类实现了接口org.apache.kafka.common.serialization.Serializer
spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer
 
#值的Serializer类，实现类实现了接口org.apache.kafka.common.serialization.Serializer
spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer
 
#如果该值大于零时，表示启用重试失败的发送次数
spring.kafka.producer.retries
#################producer的配置参数（结束）#################


#################listener的配置参数（结束）#################
#侦听器的AckMode,参见https://docs.spring.io/spring-kafka/reference/htmlsingle/#committing-offsets
#当enable.auto.commit的值设置为false时，该值会生效；为true时不会生效
#RECORD 每处理一条commit一次
#BATCH(默认) 每次poll的时候批量提交一次，频率取决于每次poll的调用频率
#TIME 每次间隔ackTime的时间去commit(跟auto commit interval有什么区别呢？)
#COUNT 累积达到ackCount次的ack去commit
#COUNT_TIME ackTime或ackCount哪个条件先满足，就commit
#MANUAL listener负责ack，但是会批量提交偏移量
#MANUAL_IMMEDIATE listner负责ack，每调用一次，就立即commit
spring.kafka.listener.ack-mode;
 
#在侦听器容器中运行的线程数
spring.kafka.listener.concurrency;
 
#轮询消费者时使用的超时（以毫秒为单位）
spring.kafka.listener.poll-timeout;
 
#当ackMode为“COUNT”或“COUNT_TIME”时，偏移提交之间的记录数
spring.kafka.listener.ack-count;
 
#当ackMode为“TIME”或“COUNT_TIME”时，偏移提交之间的时间（以毫秒为单位）
spring.kafka.listener.ack-time;
#################listener的配置参数（结束）#################

3、编写生产者

@Component
public class KafkaProducer {
    
    @Autowired
    private KafkaTemplate<String, Object> kafkaTemplate;
    
    public void send(String msg) {
        kafkaTemplate.send("DrewTest", msg);
    }
}

4、编写消费者

@KafkaListener(topics = "DrewTest", groupId = "DrewGroup")
    public void getMsgAndAutoCommit(String msg) {
        String name = Thread.currentThread().getName();
        System.out.println(name + ":" + msg);
    }

5、手动控制消费偏移量提交；

修改enable-auto-commit为false，ack-mode为MANUAL或MANUAL_IMMEDIATE；这里创建了一个config类，目的仅在于示例如何手动配置kafka，你也可以直接修改application.properties

/**
 * 
 * spring内部已经帮我们实现了这一配置类，这里写这个kafka配置类，
 * 只是单纯说明下kafka是如何使用application.properties文件里的参数，
 * 同时如果有需要配置不同kafka参数，例如有些消费者偏移量需手动提交，有些自动提交，
 * 也可以通过配置多个ConcurrentKafkaListenerContainerFactory或KafkaTemplate，
 * 然后在使用时指定。这里示例了如何配置手动提交偏移量
 * 
 * @Since:2019年5月22日
 * @Version:1.1.0
 */
@Configuration
@EnableKafka
public class KafkaConfig {
    @Value("${spring.kafka.producer.bootstrap-servers}")
    private String servers;
    
    @Value("${spring.kafka.producer.retries}")
    private int retries;
    
    @Value("${spring.kafka.producer.batch-size}")
    private int batchSize;
    
    @Value("${spring.kafka.producer.buffer-memory}")
    private int bufferMemory;
    
    @Value("${spring.kafka.consumer.bootstrap-servers}")
    private String brokers;
    
    /*生产者配置*/
    public Map<String, Object> producerConfigs() {
        Map<String, Object> props = new HashMap<>();
        props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, servers);
        props.put(ProducerConfig.RETRIES_CONFIG, 2);
        props.put(ProducerConfig.BATCH_SIZE_CONFIG, batchSize);
        props.put(ProducerConfig.BUFFER_MEMORY_CONFIG, bufferMemory);
        props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
        props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
        return props;
    }
    
    public ProducerFactory<String, Object> producerFactory() {
        return new DefaultKafkaProducerFactory<>(producerConfigs());
    }
    
    @Bean
    @Primary
    public KafkaTemplate<String, Object> kafkaTemplate() {
        return new KafkaTemplate<>(producerFactory());
    }
    
    /*消费者配置*/
    public Map<String, Object> consumerConfigs() {
        Map<String, Object> props = new HashMap<>();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, brokers);
        props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, false);
        props.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "100");
        props.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, "15000");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
        return props;
    }
    
    public ConsumerFactory<String, Object> consumerFactory() {
        return new DefaultKafkaConsumerFactory<>(consumerConfigs());
    }
    
    @Bean
    @Primary
    public ConcurrentKafkaListenerContainerFactory<String, Object> kafkaListenerContainerFactory() {
        ConcurrentKafkaListenerContainerFactory<String, Object> factory =
            new ConcurrentKafkaListenerContainerFactory<>();
        factory.setConsumerFactory(consumerFactory());
        factory.setConcurrency(2);
        factory.getContainerProperties().setPollTimeout(4000);
        //如果enable.auto.commit设为false，但是不设置AckMode，则交由spring自动提交偏移量
        factory.getContainerProperties().setAckMode(AckMode.MANUAL);
        return factory;
    }
    
}

编写消费者

/**
     * @param record 消息对象
     * @param acknowledgment 偏移量提交类
     */
    @KafkaListener(topics = "DrewTest", groupId = "DrewGroup")
    public void getMsgAndUnAutoCommit(ConsumerRecord<Object, String> record, Acknowledgment acknowledgment) {
        System.out.println("key:" + record.key() + "/offset:" + record.offset() + "/value:" + record.value()
            + "/partition:" + record.partition() + "/timestamp" + record.timestamp() + "/topics:" + record.topic());
        //手动提交偏移量
        acknowledgment.acknowledge();
    }

6、消费某个时间点之后的数据，这里有两种方法：

一种是创建一个新的group组，设置auto.offset.reset为earliest，在消费时判断时间戳

@KafkaListener(topics = "DrewTest", groupId = "DrewGroup1")
    public void getMsgAndUnAutoCommit(ConsumerRecord<Object, String> record, Acknowledgment acknowledgment) {
        LocalDateTime dataTime =
            LocalDateTime.ofInstant(Instant.ofEpochMilli(record.timestamp()), ZoneId.systemDefault());
        //判断时间戳
        LocalDateTime time = LocalDateTime.of(2019, 5, 23, 10, 07);
        //过滤这个时间点前的数据
        if (dataTime.isAfter(time)) {
            System.out.println("key:" + record.key() + "/offset:" + record.offset() + "/value:" + record.value()
                + "/partition:" + record.partition() + "/timestamp:" + dataTime + "/topics:" + record.topic());
        }
        //手动提交偏移量
        acknowledgment.acknowledge();
    }

一种是修改原有group组消费的偏移量，由于根据时间戳设置偏移量需要用到KafkaConsumer这个对象，但是springBoot把这个对象包装维护起来，同时没有提供初始化时根据时间戳设置偏移量的方法，所以我们必须自己创建一个KafkaConsumer对象，而且因为kafka里相同分区不能给同一个group里的不同客户端消费，所以我们在调用以下方法时必须停掉其他所有客户端

/**
     * 按groupid和topic修改offset
     */
    public void updateOffset(String groupId, String topic) {
        Map<String, Object> props = new HashMap<>();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, brokers);
        props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");
        props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.GROUP_ID_CONFIG, groupId);
        //创建consumer对象
        KafkaConsumer consumer = new KafkaConsumer(props);
        //订阅topic
        consumer.subscribe(Collections.singletonList(topic));
        //根据topic获取分区对象
        List<PartitionInfo> partitionInfos = consumer.partitionsFor(topic);
        //获取8小时前的时间戳
        LocalDateTime time = LocalDateTime.now();
        time = time.minus(8, ChronoUnit.HOURS);
        long fetchDataTime = time.atZone(ZoneId.systemDefault()).toInstant().toEpochMilli();
        // 获取每个partition 8个小时之前的偏移量
        Map<TopicPartition, Long> timestampsToSearch = new HashMap<>();
        for (PartitionInfo partitionInfo : partitionInfos) {
            timestampsToSearch.put(new TopicPartition(partitionInfo.topic(), partitionInfo.partition()), fetchDataTime);
        }
        Map<TopicPartition, OffsetAndTimestamp> map = consumer.offsetsForTimes(timestampsToSearch);
        //seek前要先poll，否则会报错
        consumer.poll(0);
        OffsetAndTimestamp offsetTimestamp = null;
        System.out.println("开始设置各分区初始偏移量...");
        for (Map.Entry<TopicPartition, OffsetAndTimestamp> entry : map.entrySet()) {
            // 如果设置的查询偏移量的时间点大于最大的索引记录时间，那么value就为空
            offsetTimestamp = entry.getValue();
            if (offsetTimestamp != null) {
                int partition = entry.getKey().partition();
                long timestamp = offsetTimestamp.timestamp();
                long offset = offsetTimestamp.offset();
                System.out.println("partition = " + partition + ", time = "
                    + LocalDateTime.ofInstant(Instant.ofEpochMilli(timestamp), ZoneId.systemDefault()) + ", offset = "
                    + offset);
                // 设置读取消息的偏移量
                consumer.seek(entry.getKey(), offset);
            }
        }
        System.out.println("设置各分区初始偏移量结束...");
        //提交偏移量
        consumer.commitSync();
        consumer.close();
    }

Drew晓

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
SpringBoot整合kafka

1、搭建项目，在https://start.spring.io/网站中，添加kafka依赖，生成项目2、在application.properties文件中添加kafka配置#生产者#kafka服务器地址spring.kafka.producer.bootstrap-servers=xx.xx.xx.xx:9092,xx.xx.xx.xx:9091#重发次数spring.ka...
复制链接

扫一扫

专栏目录