本ppt来自于4月23-25日举行的 Spark + AI Summit 2019,分享嘉宾为Maryann Xue, Xingbo Jiang, Kris Mok。
Spark SQL 使得我们能够使用分析数据库技术执行高效且具有容错的关系查询。本文深入探讨Spark SQL执行引擎。内容包括物理计划、全阶段代码生成(whole-stage code generation)、Stage 执行、UDF执行、内存管理、矢量化读取器(vectorized readers),基于血统的 RDD 转换和操作、PySpark 和 Pandas
关注 过往记忆大数据 微信公众号并回复 sparksql 获取本文 PPT。
欢迎关注本公众号:iteblog_hadoop:
回复 spark_summit_201806 下载 Spark Summit North America 201806 全部PPT
回复 spark_summit_eu_2018 下载 Spark+AI Summit europe 2018 全部PPT
回复 HBase_book 下载 2018HBase技术总结 专刊
回复 all 获取本公众号所有资料
0、回复 电子书 获取 本站所有可下载的电子书
1、Apache Spark 2.4 回顾以及 3.0 展望
2、重磅 | Apache Spark 社区期待的 Delta Lake 开源了
3、Apache Spark 3.0 将内置支持 GPU 调度
11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档: http://flink.iteblog.com 13、Carbondata 中文文档: http://carbondata.iteblog.com