第23章Spark集群中Mapper端、Reducer端内存调优
本章主要讲解如下内容:
l Spark集群中Mapper端内存调优最佳实践;
l Spark集群中Reducer端内存调优最佳实践。
23.1 Mapper端内存调优
本节讲解Spark集群中Mapper端内存使用详解以及性能调优最佳实践。
23.1.1 Spark集群中Mapper端内存使用详解
Spark集群Shuffle分为2部分:Mapper端和Reducer端。本节讲解Spark集群中Mapper端内存使用。Spark集群中的Shuffle是非常重要的,Shuffle的特殊在于我们依赖于所有的数据,RDD的依赖是后面的RDD依赖前面的RDD