Flink FileSystem的connector分析

最新推荐文章于 2024-08-06 04:55:30 发布

Android路上的人

最新推荐文章于 2024-08-06 04:55:30 发布

阅读量2.7k

点赞数

本文链接：https://blog.csdn.net/androidlushangderen/article/details/85918005

版权

本文深入探讨Flink FileSystem连接器中的RollingSink特性，详细阐述了在checkpoint机制下，如何实现 Exactly Once 的恢复语义。通过文件状态的In-progress、Pending和Finalized转换，确保数据一致性。在恢复过程中，着重处理了in-progress和pending文件，避免脏数据，并保证文件状态的正确迁移。

摘要由CSDN通过智能技术生成

文章目录

前言
FileSystem的RollingSink
FileSystem连接器的Exactly Once恢复语义
- FileSystem Sink的文件状态转换
- Checkpoint下的Exactly Once恢复

前言

从目前最新的Flink代码来看，现在它能够支持越来越多的connector类型了，不仅仅说包括于前面的Source的连接，还有后面Sink的选择。但是Flink的连接器不是简简单单的说做一个外部数据源系统的连接就OK的，而是要有一定的Exactly Once的恢复能力。因为Flink应用在做checkpoint的时候，要从前面的源到后续的Sink都得到完整的恢复。今天本文来讲述其中的基于文件系统的连接器实现，笔者主要阐述它在checkpoint模式下，如何做Exactly Once的恢复的。