KeyValue对RDDs的Transfomations
example {(1,2), (3,4), (3,6)}
conbineByKey()
最常用的基于key的聚合函数, 返回类型可以跟数据类型不一样
许多基于key的聚合函数都用到了它, 像groupByKey()
遍历partion中的元素, 元素的key, 要么之前见过, 要么不是
如果是新元素, 使用参数中提供的createCombiner()函数
如果是这个partition中已经存在的key, 则会使用mergrValue()这个函数
合计每个partition的结果的时候, 使用mergeCombiners()函数