新手会对官方文档比较陌生,不知道从何入手,下面整理基于 Spark 的常用文档链接
Apache Spark Github
https://github.com/apache/spark
Apache Spark 官网网站
http://spark.apache.org
Spark 历史版本(含源码)
https://archive.apache.org/dist/spark/
Spark 入门手册
http://spark.apache.org/documentation.html
Spark 文档中文版
从 Apache Spark 官方网站翻译而来:Spark 2.2.0
Spark 最佳实战电子书
Apache Spark - Best Practices and Tuning
Spark 2.3.0
Spark 2.3.0 API
- Scala API
- Java API
- Python API
- R API
- Spark-SQL 内建函数
Spark 2.3.0 开发向导
- Spark 初体验
- RDD、累加器和广播变量
- Spark-SQL
- Structured Streaming
- Spark Streaming
- Spark 机器学习
- Spark 图计算
Spark 2.3.0 部署向导
- 如何提交一个 Spark 任务
- 提交一个 Spark 任务到 YARN
- 提交一个 Spark 任务到 k8s
其它
- Spark 配置
- 编译 Spark 源码