将 SQL文本 / TableAPI 代码转化为逻辑执行计划(Logical Plan)
Logical Plan 通过优化器优化为物理执行计划(Physical Plan)
通过代码生成技术生成 Transformations 后进一步编译为可执行的 JobGraph 提交运行
row_number() over 求max min的方式,
流式场景求解极大 / 小值的最优操作是通过维护一个 size 为 N 的 minHeap / maxHeap。由实现反推出我们需要在优化器上新增一条规则,在遇到 ROW_NUMBER 生成的逻辑节点后,将其优化为一个特殊的 Rank 节点,对应上述的最优实现方式(当然这只是特殊 Rank 对应的其中一种实现)。