通过高级性能调整深入了解 Spark SQL

最新推荐文章于 2023-01-31 22:05:23 发布

Hadoop技术博文

最新推荐文章于 2023-01-31 22:05:23 发布

阅读量726

点赞数

本文资料来自于 2018-06-04 ~ 06 日在旧金山进行的 Spark + AI summit，分享作者为 Xiao Li 和 Wenchen Fan，两位都是 Databricks 的工程师，Spark PMC 以及 Committer。

本文 PPT 下载地址：

https://www.iteblog.com/ppt/DDI-Spark-SQL.pdf (点击下面阅读原文即可)

http://cdn.iteblog.com/ppt/DDI-Spark-SQL.pdf

https://download.csdn.net/download/w397090770/10471189

Spark SQL 是一个高度可扩展且高效的关系处理引擎，具有易于使用的 API 和中间查询容错功能。它是 Apache Spark 的核心模块。Spark SQL可以处理，整合和分析来自不同数据源（例如Hive，Cassandra，Kafka和Oracle）和文件格式（例如Parquet，ORC，CSV和JSON）的数据。这次演讲将深入 SparkSQL 的技术细节，涵盖查询执行的整个生命周期。通过本文将对 Spark SQL 有更深入的了解，以及了解如何调整Spark SQL的性能。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

猜你喜欢

欢迎关注本公众号：iteblog_hadoop:

0、回复 电子书 获取 本站所有可下载的电子书

1、Apache Spark 统一内存管理模型详解

2、HDFS 副本存放磁盘选择策略详解

3、盘点2017年晋升为Apache TLP的大数据相关项目

4、干货 | 深入理解 Spark Structured Streaming

5、Apache Spark 黑名单(Blacklist)机制介绍

6、Kafka分区分配策略(Partition Assignment Strategy)

7、Spark SQL 你需要知道的十件事

8、干货 | Apache Spark 2.0 作业优化技巧

9、[干货]大规模数据处理的演变(2003-2017)

10、干货 | 如何使用功能强大的 Apache Flink SQL

11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档：http://flink.iteblog.com 13、Carbondata 中文文档：http://carbondata.iteblog.com

640?wx_fmt=png

Hadoop技术博文

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
通过高级性能调整深入了解 Spark SQL

本文资料来自于 2018-06-04 ~ 06 日在旧金山进行的 Spark + AI summit，分享作者为 Xiao Li 和 Wenchen Fan，两位都是 D...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。