算子就是映射,就是关系,就是变换 有输入输出 f(x) = abs(x) abs就是算子 一个或多个算子+操作数就组成了算法
有向无环图(DAG)
1.environment 当前的flink运行环境,只有获取了环境信息
// 批处理环境 dataset
val env = ExecutionEnvironment.getExecutionEnvironment
// 流式数据处理环境 datastream
val env = StreamExecutionEnvironment.getExecutionEnvironment
2.source 从不同的来源获取数据 kafka 文件 自定义
3.transform 各种算子-操作方法
4.sink 将数据存储起来的意思
Flink主要有两类进程: JobManager协调分布式计算、任务调度 和 TaskManager 流计算一般分为有状态和无状态两种