1 资源规划
1.1 资源设定考虑
1、总体原则
以单台服务器128G内存,32线程为例。
本文详细探讨了Spark资源调优,包括资源规划、持久化和序列化以及CPU优化。在资源规划中,介绍了如何根据服务器配置设定Executor的核数和内存。在持久化和序列化部分,对比了RDD与DataFrame/Dataset的缓存策略。最后,分析了CPU低效的原因,并提出合理利用CPU资源的方法,如调整并行度和shuffle分区个数。
1、总体原则
以单台服务器128G内存,32线程为例。
962
566

被折叠的 条评论
为什么被折叠?