Spark算子分析
Forrestleo
这个作者很懒,什么都没留下…
展开
-
浅析sortByKey算子
一、简介spark中用于排序的算子主要有两个,sortByKey与sortBy,其中sortBy是引用sortByKey来实现的。下面主要对sortByKey算子进行分析,该方法的实现代码如下: def sortByKey(ascending: Boolean = true, numPartitions: Int = self.partitions.length) : RDD[(K, V)] =原创 2017-02-10 12:55:41 · 3710 阅读 · 0 评论 -
浅析Spark的RangePartitioner
Spark版本推进到2.0,其在shuffle时提供的partitioner主要有两种,HashPartitioner与RangePartitioner。本文主要对RangePartitioner的实现作一简单说明。原创 2017-02-10 14:42:18 · 2349 阅读 · 0 评论