Flink1.15 DataSream 连接器 —— FileSystem源码阅读及代码示例

接上篇《Flink1.15 DataSream 连接器 —— FileSystem

代码全景

在这里插入图片描述
在这里插入图片描述

从上图中可以看到src和sink ,以及隐藏在下面的table,这仨个目录分别是:

  • src: 即File Source,也是Source API,这是一个读取文件的统一数据源——且可以批处理和流模式读取
  • sink: 即File Sink,也是Sink API ,文件接收器将传入的数据写入桶中。考虑到传入的流可以是无界的,每个桶中的数据被组织成有限大小的部分文件。桶行为是完全可配置的,使用默认的基于时间的桶,我们每小时开始写一个新桶。这意味着每个生成的桶将包含从流中间隔1小时接收到的记录的文件
  • table:即table API,在官网上暂时没有看到介绍这个table目录下相关api,本次也不会阅读该部分源码

UML 图

上面大概看了代码在idea中结构,现在再来看下各个模块的uml类图,理解起来更加方便。

File Source

在这里插入图片描述
上面是src的全景图,现在我们可以试着裁剪一下,看最后主要的类有哪些,分别是干什么用的?

去除掉@Deprecated被弃用类

reader/FileRecordFormat.java
reader/TextLineFormat.java
impl/FileRecordFormatAdapter.java

去掉工具类、参数配置类等

在这里插入图片描述

上图中可以看出创建一个文件源FileSource。并且在其类内部FileSourceBuilder,您可以在其上配置文件源的所有属性。在上图中,可以看到创建切片分发器,监控间隔时间,文件枚举器,还有阅读器的文件格式类型,有无边界,切割器序列化等。
在这里插入图片描述
切片分发器。
在这里插入图片描述
SplitEnumerator负责发现和标识要读取的文件,并将它们分配给SourceReader。
在这里插入图片描述
SourceReader请求它需要处理的文件,并从文件系统读取文件。
在这里插入图片描述

File Sink

在这里插入图片描述
上面是sink的全景图,现在我们可以试着裁剪一下,看最后主要的类有哪些,分别是干什么用的?

去除掉@Deprecated被弃用类

没有需要弃用的类

去掉工具类、参数配置类等

在这里插入图片描述
文件接收器将传入的数据写入桶中。考虑到传入的流可以是无界的,每个桶中的数据被组织成有限大小的部分文件。桶行为是完全可配置的,使用默认的基于时间的桶,我们每小时开始写一个新桶。这意味着每个生成的桶将包含从流中间隔1小时接收到的记录的文件。

桶目录中的数据被分割为部分文件。每个桶将包含接收到该桶数据的接收器的每个子任务的至少一个部分文件。附加的零件文件将根据可配置的滚动策略被创建。对于行编码格式(请参阅文件格式),默认策略根据大小、指定文件可打开的最长时间的超时和关闭文件的最长不活动超时来滚动部分文件。对于Bulk-encoded format,我们滚动每个检查点,用户可以根据大小或时间指定附加条件。

另外上图中可以看到BulkformatBuilder and RowformatBuilder,然后里面有很多方法,这些具体的操作的类都在sink这个目录下。

File Table

在这里插入图片描述

table目录下的源码请自行阅读。

代码示例

github地址奉上,就不占用篇幅了。
FileSource and FileSink代码案例

结语

最后,提醒一下看源码的小伙伴们,最好看下test目录下的测试类,flink源码中提供了很多测试类,可以细节到具体的方法,所以值得一看。

欢迎批评指正,谢谢。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

京河小蚁

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值