目录
源(Source)是程序读取输入的地方。您可以使用StreamExecutionEnvironment.addSource(sourceFunction)将源附加到程序中。Flink附带了许多预实现的源函数(source functions),但是您始终可以
(1)通过实现SourceFunction来定义自己的非并行源(non-parallel sources),
(2)或者通过实现ParallelSourceFunction接口或扩展RichParallelSourceFunction来定义自己的并行源(parallel sources)。
有几个预定义的流源(stream sources)可以从StreamExecutionEnvironment中访问:
基于文件的
(1)readTextFile(path) -逐行读取文本文件,即尊重TextInputFormat规范的文件,并将其作为字符串返回。
(2)readFile(fileInputFormat, path) -按照指定的文件输入格式读取(一次)文件。
(3)readFile(fileInputFormat, path, watchType, interval, pathFilter, typeInfo) -这是前两个方法在内部调用的方法。它根据给定的fileInputFormat读取路径中的文件。根据所提供的watchType,该源可以定期监视(每隔毫秒