第二章 流处理基础 Dataflow图 至少有一个输入源一个输出汇,是一个有向图;算子是Dataflow中基本的功能单元。 从不同的抽象层次将Dataflow分为宏观上的逻辑图和实际运行时的物理结构图 并行性的体现: 数据并行:将输入数据分组,让执行同一操作的不同算子实例作用在不同的数据子集上;均衡负载 任务并行:将输入数据复制多份,交给执行不同操作的算子实例处理 数据交换策略 怎样将数据分配给物理Dataflow中的算子实例<