1 Spark3.0 AQE
Spark 在 3.0 版本推出了 AQE(Adaptive Query Execution),即自适应查询执行。AQE 是 Spark SQL 的一种动态优化机制,在运行时,每当 Shuffle Map 阶段执行完毕,AQE 都会结合这个阶段的统计信息,基于既定的规则动态地调整、修正尚未执行的逻辑计划和物理计划,来完成对原始查询语句的运行时优化。
Spark3.0引入了Adaptive Query Execution (AQE),包括动态合并分区、动态切换Join策略和动态优化Join倾斜。动态合并分区解决了过多或过少分区的问题,动态切换Join策略能根据运行时数据大小动态选择最优Join类型,动态优化Join倾斜通过拆分倾斜分区提升性能。此外,Spark3.0还增强了Hint功能,支持更多的Join类型提示。
Spark 在 3.0 版本推出了 AQE(Adaptive Query Execution),即自适应查询执行。AQE 是 Spark SQL 的一种动态优化机制,在运行时,每当 Shuffle Map 阶段执行完毕,AQE 都会结合这个阶段的统计信息,基于既定的规则动态地调整、修正尚未执行的逻辑计划和物理计划,来完成对原始查询语句的运行时优化。
1215
2万+

被折叠的 条评论
为什么被折叠?