flink 1.14版本kafkaconnector问题

最新推荐文章于 2024-07-16 09:52:14 发布

Flakej

最新推荐文章于 2024-07-16 09:52:14 发布

阅读量193

点赞数

文章标签： flink 大数据

本文链接：https://blog.csdn.net/qq_39096189/article/details/132107758

版权

flink 1.14版本kafkaconnector问题

—	Version
flink	1.14.5
kafka	2.2.1

kafkasource

kafkasource指定offset时，除了earlest和直接指定offset 外latest与时间戳处消费并不生效，reseting offset总是指定当前的offset，看源码并没有找到问题出在哪里，因此退而求，提前获取该消费者组的offset，传入offset实现。

public static OffsetsInitializer getTopicPartitons(OffsetUtils offsetUtil, String groupId, String... topics) {
        prop.put(ConsumerConfig.GROUP_ID_CONFIG, groupId);
        OffsetsInitializer offsetsInitializer = OffsetsInitializer.earliest();
        if (offsetUtil.getOffestEnum().equals(OffestEnum.EARLIEST)) {
            offsetsInitializer = OffsetsInitializer.earliest();
        } else if (OffestEnum.LATEST.equals(offsetUtil.getOffestEnum())) {
            KafkaConsumer<String, String> consumer = new KafkaConsumer<>(prop);
            HashMap<TopicPartition, Long> topicPartitions = new HashMap<>();
            for (String topic : topics) {
                List<PartitionInfo> partitionInfos = consumer.partitionsFor(topic);
                Set<TopicPartition> topicPartitionList = new HashSet<>();
                for (PartitionInfo partitionInfo : partitionInfos) {
                    TopicPartition topicPartition = new TopicPartition(topic, partitionInfo.partition());
                    topicPartitionList.add(topicPartition);
                }
                HashMap<TopicPartition, Long> tmepMaps = new HashMap<>();
                Map<TopicPartition, OffsetAndMetadata> committed = consumer.committed(topicPartitionList);
                Map<TopicPartition, Long> begaininge = consumer.endOffsets(topicPartitionList);
                boolean flag = false;
                for (TopicPartition topicPartition : committed.keySet()) {
                    if (committed.get(topicPartition) == null) {
                        flag = true;
                        break;
                    }
                }
                if (!flag) {
                    for (TopicPartition topicPartition : committed.keySet()) {
                        tmepMaps.put(topicPartition, committed.get(topicPartition).offset());
                    }
                } else {
                    System.out.println("-----------------无法找到上次提交offset，建议传入时间----------------------------");
                    for (TopicPartition topicPartition : begaininge.keySet()) {
                        tmepMaps.put(topicPartition, begaininge.get(topicPartition));
                    }
                }
                for (TopicPartition topicPartition:topicPartitions.keySet()){
                    System.out.println(topicPartition.topic()+":"+topicPartition.partition()+":"+topicPartitions.get(topicPartition));
                }
                topicPartitions.putAll(tmepMaps);
            }
            offsetsInitializer = OffsetsInitializer.offsets(topicPartitions);
        } else if (OffestEnum.TIMESTAMP.equals(offsetUtil.getOffestEnum())) {
            KafkaConsumer<String, String> consumer = new KafkaConsumer<>(prop);
            Map<TopicPartition, Long> topicPartitions = new HashMap<>();
            for (String topic : topics) {
                List<PartitionInfo> partitionInfos = consumer.partitionsFor(topic);
                ArrayList<TopicPartition> topicPartitionList = new ArrayList<>();
                Map<TopicPartition, Long> tmepMaps = new HashMap<TopicPartition, Long>();
                for (PartitionInfo partitionInfo : partitionInfos) {
                    TopicPartition topicPartition = new TopicPartition(topic, partitionInfo.partition());
                    topicPartitionList.add(topicPartition);
                    tmepMaps.put(topicPartition, offsetUtil.getDateO());
                }
                Map<TopicPartition, OffsetAndTimestamp> tme = consumer.offsetsForTimes(tmepMaps);
                Map<TopicPartition, Long> tmepMaps1 = new HashMap<TopicPartition, Long>();
                boolean flag = false;
                for (TopicPartition topicPartition : tme.keySet()) {
                    if (tme.get(topicPartition) == null) {
                        topicPartitions = consumer.endOffsets(topicPartitionList);
                        flag = true;
                        System.out.println("------------------------无法根据时间戳消费，将从最新offset消费----------------------------");
                        break;
                    }
                }
                if (!flag) {
                    for (TopicPartition topicPartition : tme.keySet()) {
                        tmepMaps1.put(topicPartition, tme.get(topicPartition).offset());
                    }
//                    topicPartitions.clear();
                    topicPartitions.putAll(tmepMaps1);
                }
            }
            for (TopicPartition topicPartition:topicPartitions.keySet()){
                System.out.println(topicPartition.topic()+":"+topicPartition.partition()+":"+topicPartitions.get(topicPartition));
            }
            offsetsInitializer = OffsetsInitializer.offsets(topicPartitions);
        }
        if (offsetsInitializer.equals(OffsetsInitializer.earliest()) && !offsetUtil.getOffestEnum().equals(OffestEnum.EARLIEST)) {
            throw new NullPointerException("params is not true");
        }
        return offsetsInitializer;
    }

这样传入kafkaoffset可以解决。

kafkasink

当我们使用上方展示kafkasource时，并没有提前获取offset时，kafkasink 部分消息写入，不同时间写入相同消息时间戳不变，一直是该条数据第一次进入kafka时间，很奇怪，最终只能手写一个kafkaproducer，手动传入时间戳。最后传入方法kafkasource.setStartingOffset 自取后，这个现象现在暂时没有再次遇到。

Flakej

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
flink 1.14版本kafkaconnector问题

最后传入方法kafkasource.setStartingOffset 自取后，这个现象现在暂时没有再次遇到。kafkasource指定offset时，除了earlest和直接指定offset 外latest与时间戳处消费并不生效，reseting offset总是指定当前的offset，看源码并没有找到问题出在哪里，因此退而求，提前获取该消费者组的offset，传入offset实现。这样传入kafkaoffset可以解决。
复制链接

扫一扫