Spark 3.3.2概览
主要模块如下
- RDD编程
- Spark SQL
- Structured Streaming
- Spark Steaming
- Spark SQL CLI
Spark具有多种的运行方式,shell,pyspark,spark-submit等等。可以运行在集群上,支持standalone,yarn,kubernetes不同模式。
Spark提交流程
- 集群模式
- Submitting Applications
- YARN
- Kubernetes
还有一些其他的文档
- Configuration
- Monitoring
- Tuning Guide
- Job Scheduling
- Security
- Hardware Provisioning
- 其他存储系统
- 第三方项目
该系列整体的学习翻译路径也会和上述的步骤一致.