flink-kafka端到端精准一次性

sleepyli

已于 2022-01-24 16:42:30 修改

阅读量2.6k

点赞数 1

分类专栏： kafka flink 文章标签： kafka flink big data

于 2021-12-22 17:19:07 首次发布

本文链接：https://blog.csdn.net/qq_31425415/article/details/122090512

版权

flink-kafka端到端精准一次性producer有事务//FlinkKafkaProducer 默认不读取全局配置而是写死默认值AT_LEAST_ONCE 在创建KafkaProducer时要指定时间语义详见: new FlinkKafkaProducer<>()Optional<FlinkFixedPartitioner<String>> customPartitioner = Optional.of(new FlinkFixedPartitioner

摘要由CSDN通过智能技术生成

flink-kafka端到端精准一次性

producer有事务

//FlinkKafkaProducer 默认不读取全局配置而是写死默认值AT_LEAST_ONCE 在创建KafkaProducer时要指定时间语义 详见: new FlinkKafkaProducer<>()
Optional<FlinkFixedPartitioner<String>> customPartitioner = Optional.of(new FlinkFixedPartitioner<>());
            flinkKafkaProducer = new FlinkKafkaProducer<>(topic,
                    new SimpleStringSchema(),
                    producerProp,
                    customPartitioner.orElse(null),
                    FlinkKafkaProducer.Semantic.EXACTLY_ONCE,
                    DEFAULT_KAFKA_PRODUCERS_POOL_SIZE);
//生产者的事务超时属性 使用EXACTLY_ONCE需要增加
producerProp.put(ProducerConfig.TRANSACTION_TIMEOUT_CONFIG, 1000 * 60 * 5);
//设置事务ID,这里用了类名做唯一ID
producerProp.put(ProducerConfig.TRANSACTIONAL_ID_CONFIG, getClassName());
//开启幂等性
producerProp.put(ProducerConfig.ENABLE_IDEMPOTENCE_CONFIG,"true");
producerProp.put(ProducerConfig.MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION,"5");

consumer 有偏移量且设置读已提交

//设置为读已提交
consumerProp.setProperty(ConsumerConfig.ISOLATION_LEVEL_CONFIG,"read_committed");

中间有checkpoint 所以flink整合kafka 可以实现完整的精准一次性
注意: flink-kafka精准一次的致命弱点: 在进行checkpoint时才会将数据提交到kafka,导致流处理会转换成微批处理(微批的大小为checkpoint的间隔时间)

代码样例

pom.xml

特别注意如果是本地只用导入flink-connector-kafka_2.12即可
如果是flink集群上需要导入以下三个包才能正常使用kafka 因为flink-connector-kafka包中把后面两个排除掉了
- flink-connector-kafka_2.12-1.12.0
- flink-connector-kafka-base_2.12-1.12.0
- kafka-clients-2.2.0

<dependency>
    &l

最低0.47元/天解锁文章

sleepyli

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
flink-kafka端到端精准一次性

flink-kafka端到端精准一次性producer有事务//FlinkKafkaProducer 默认不读取全局配置而是写死默认值AT_LEAST_ONCE 在创建KafkaProducer时要指定时间语义详见: new FlinkKafkaProducer<>()Optional<FlinkFixedPartitioner<String>> customPartitioner = Optional.of(new FlinkFixedPartitioner
复制链接

扫一扫