本文从十个方面介绍 Spark SQL 的使用及注意事项,主要包括:
Spark SQL 使用场景
数据加载:云和本地, RDDs 和 DataFrames
SQL 和 DataFrame API 比较,它们之间的区别
模式: 隐式和显示模式解释,数据类型
数据加载以及结果保存等
SQL 使用场景,什么时候不适合使用 SQL
使用 SQL 进行 ETL
操作 JSON 数据
从外部数据库读取和写入
在真实环境下测试你的 SQL
本文PPT资料请到 https://www.iteblog.com/s.pdf 或者
http://cdn.iteblog.com/s.pdf 下载,直接点击下面的 阅读原文 即可获取。(如需要高清 ppt 文档请私信获取)
欢迎关注本公众号:iteblog_hadoop:
0、回复 电子书 获取 本站所有可下载的电子书
3、盘点2017年晋升为Apache TLP的大数据相关项目
5、Apache Spark 黑名单(Blacklist)机制介绍
7、Apache CarbonData里程碑式版本1.3发布,多个重要新特性
8、干货 | Apache Spark 2.0 作业优化技巧
10、干货 | 如何使用功能强大的 Apache Flink SQL
11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档:http://flink.iteblog.com