
flink数据源#
这两种情况之间的差异很小:在有界/批处理情况下,枚举器会生成一组固定的拆分,并且每个拆分必然是有限的。在无界流式处理情况下,两者之一不成立(拆分不是有限的,或者枚举器不断生成新的拆分)。一旦找到新文件,它就会为它们生成新的拆分,并可以将它们分配给可用的 SourceReaders。是源使用的数据的一部分,如文件或日志分区。下面是一些简化的概念示例,用于说明数据源组件在流式处理和批处理情况下的交互方式。源具有要读取的目录的 URI/路径,以及定义如何分析文件的。的积压工作,并以平衡的方式将它们分配给读取器。










