spark3.0-spark入门-总结知识要点
day01-知识要点
1.Spark负责什么事,设计自己调度器的原因?
2.Spark为什么比Hadoop快?
3.如何提交一个Spark任务?主要参数有哪些?
4.spark-standalone模式配置了哪些文件?
5.spark-yarn模式配置了哪些文件?
6.画出在Yarn-Client模式下提交任务的流程图。
7.画出在Yarn-Cluster模式下提交任务的流程图。
8.简述你所理解的spark不同运行模式之间的区别,开发时怎么选择
9.spark端口号总结
10.[机考] idea内利用spark框架实现wordcount代码,并且打包提交到yarn集群运行