深入理解 Spark SQL 查询引擎

最新推荐文章于 2022-03-02 09:41:41 发布

Hadoop技术博文

最新推荐文章于 2022-03-02 09:41:41 发布

阅读量265

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/b6ecl1k7BS8O/article/details/91410264

版权

本ppt来自于4月23-25日举行的 Spark + AI Summit 2019，分享嘉宾为Maryann Xue, Xingbo Jiang, Kris Mok。

Spark SQL 使得我们能够使用分析数据库技术执行高效且具有容错的关系查询。本文深入探讨Spark SQL执行引擎。内容包括物理计划、全阶段代码生成（whole-stage code generation）、Stage 执行、UDF执行、内存管理、矢量化读取器（vectorized readers），基于血统的 RDD 转换和操作、PySpark 和 Pandas

关注 过往记忆大数据 微信公众号并回复 sparksql 获取本文 PPT。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

猜你喜欢

欢迎关注本公众号：iteblog_hadoop:

回复 spark_summit_201806 下载 Spark Summit North America 201806 全部PPT

回复 spark_summit_eu_2018 下载 Spark+AI Summit europe 2018 全部PPT

回复 HBase_book 下载 2018HBase技术总结专刊

回复 all 获取本公众号所有资料

0、回复 电子书 获取 本站所有可下载的电子书

1、Apache Spark 2.4 回顾以及 3.0 展望

2、重磅 | Apache Spark 社区期待的 Delta Lake 开源了

3、Apache Spark 3.0 将内置支持 GPU 调度

4、分布式原理：一致性哈希算法简介

5、分布式快照算法: Chandy-Lamport 算法

6、Kafka分区分配策略

7、分布式原理：一文了解 Gossip 协议

8、列式存储和行式存储它们真正的区别是什么

9、HBase Rowkey 设计指南

10、HBase 入门之数据刷写详细说明

11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档： http://flink.iteblog.com 13、Carbondata 中文文档： http://carbondata.iteblog.com

640?wx_fmt=png

640?wx_fmt=jpeg

Hadoop技术博文

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深入理解 Spark SQL 查询引擎

本ppt来自于4月23-25日举行的 Spark + AI Summit 2019，分享嘉宾为Maryann Xue, Xingbo Jiang, Kris Mok。Sp...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。