Kafka 根据时间段查询消费数据

最新推荐文章于 2024-06-06 14:39:02 发布

随风的树叶

最新推荐文章于 2024-06-06 14:39:02 发布

阅读量381

点赞数 3

文章标签： kafka linq 分布式

本文链接：https://blog.csdn.net/weixin_43877044/article/details/139173997

版权

1.主要逻辑：

    private Map<TopicPartition, OffsetAndTimestamp> getTimestampOffset(KafkaConsumer<String, byte[]> kafkaConsumer, String topic, Date date){
        Map<TopicPartition, Long> startMap = new HashMap<>();
        List<PartitionInfo> partitionInfos = kafkaConsumer.partitionsFor(topic);
        for (PartitionInfo partitionInfo : partitionInfos) {
            int partition = partitionInfo.partition();
            TopicPartition topicPartition = new TopicPartition(topic, partition);
            startMap.put(topicPartition, date.getTime());
        }
        return kafkaConsumer.offsetsForTimes(startMap);
    }


    @SneakyThrows
    private void execute(KafkaConsumer<String, byte[]> kafkaConsumer, Date startTime, Date endTime){
        Map<TopicPartition, OffsetAndTimestamp> startOffsetMap = getTimestampOffset(kafkaConsumer, topic, startTime);
        Map<TopicPartition, OffsetAndTimestamp> endOffsetMap = getTimestampOffset(kafkaConsumer, topic, endTime);
        log.info("topic {}, start offset {}, end offset {}", topic, startOffsetMap, endOffsetMap);
        List<PartitionInfo> partitionInfos = kafkaConsumer.partitionsFor(topic);
        List<TopicPartition> partitionList = new ArrayList<>();
        for (PartitionInfo partitionInfo : partitionInfos) {
            partitionList.add(new TopicPartition(topic, partitionInfo.partition()));
        }
        Map<Integer, Long> partitionMap;
        kafkaConsumer.assign(partitionList);
        for (Map.Entry<TopicPartition, OffsetAndTimestamp> entry : startOffsetMap.entrySet()) {
            kafkaConsumer.seek(entry.getKey(), entry.getValue().offset());
        }
        Set<Integer> partitionSet;
        if (endOffsetMap != null){
            partitionMap = endOffsetMap.entrySet().stream().collect(Collectors.toMap(topicPartitionOffsetAndTimestampEntry -> topicPartitionOffsetAndTimestampEntry.getKey().partition(), topicPartitionOffsetAndTimestampEntry -> {
                OffsetAndTimestamp value = topicPartitionOffsetAndTimestampEntry.getValue();
                if (value != null){
                    return value.offset();
                }else{
                    return Long.MAX_VALUE;
                }
            }, (t1, t2) -> t1));
            partitionSet = partitionMap.entrySet().stream().map(Map.Entry::getKey).collect(Collectors.toSet());
        }else{
            partitionMap = Collections.emptyMap();
            partitionSet = Collections.emptySet();
        }
        
        while(true){
            Map<Integer, Long> partitionOffsetMap = new HashMap<>();
            ConsumerRecords<String, byte[]> consumerRecords = kafkaConsumer.poll(Duration.ofMillis(10000));
            for (ConsumerRecord<String, byte[]> consumerRecord : consumerRecords) {
                partitionOffsetMap.compute(consumerRecord.partition(), (integer, aLong) -> aLong == null ? consumerRecord.offset() : Math.max(aLong, consumerRecord.offset()));
                long timestamp = consumerRecord.timestamp();
                if (timestamp < startTime.getTime() || timestamp > endTime.getTime()){
                    continue;
                }
                byte[] value = consumerRecord.value();
                //todo 消费逻辑
            }
            for (Map.Entry<Integer, Long> entry : partitionOffsetMap.entrySet()) {
                Integer partition = entry.getKey();
                Long maxOffset = entry.getValue();
                Long endOffset = partitionMap.get(partition);
                if (endOffset != null && maxOffset > endOffset && !partitionSet.isEmpty()){
                    partitionSet.remove(partition);
                }
            }
            if (consumerRecords.isEmpty() || (!partitionMap.isEmpty() && partitionSet.isEmpty())){
                break;
            }
        }
    }

2.调用逻辑

    public void run(){
        //添加kafka配置
        Map<String, Object> kafkaConfig = new HashMap<>();
        KafkaConsumer<String, byte[]> kafkaConsumer = new KafkaConsumer<>(kafkaConfig);
        execute(kafkaConsumer, startTime, endTime);
    }

3. 说明

在自定义kafka查询时（配合seek使用），需用kafkaConsumer.assign，而不是kafkaConsumer.subscribe

随风的树叶

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Kafka 根据时间段查询消费数据

在自定义kafka查询时（配合seek使用），需用kafkaConsumer.assign，而不是kafkaConsumer.subscribe。
复制链接

扫一扫

Kafka 根据 时间段查询消费数据

1.主要逻辑：

2.调用逻辑

3. 说明

Kafka 根据时间段查询消费数据