SparkSQL查询优化器帮助我们优化执行效率
【Column pruning:列裁剪;Partitioning pruning:分区裁剪,上图中使用“year”做分区裁剪】
【with Predicate Pushdown and Column Pruning:条件下压,列裁剪】
【DataFrame Internals(内部结构):A:代表内部的“逻辑计划”;B:懒加载执行,允许通过Catalytic做优化】
【DataFrame和SQL共享相同的优化器和执行通道】