val rdd-sc.makerdd(List((“a”,1),(“b”,1)(“a”,3),(“b”,4)))
rdd.reduceBYKey(+)
rdd.aggregateByKey(0)(+,+)
rdd.foldByKey(0)(+)
rdd.combineBYKey(v=>v,(x:Int,y)=>x+y,(x:Int,y:Int)=>x+y)
//
combineBYKey:
combineBYKeyWithCalssTag(
createCombine, //相同key的第一条数据进行处理操作
mergeValue, //表示分区内数据处理函数
mergeCombiners://表示分区间数据处理函数
)
foldByKey
combineBYKeyWithCalssTag[V](
(v:V)=>cleanedFunc(createwZero(),v),//初始值和第一个key的value值进行分区内操作
cleanedFunc, //分区内计算规则
cleandFunc, // 分区间计算规则·
)
aggregateByKey:
combineBYKeyWithCalssTag[V](
(v:V)=>cleanedSeqOp(createZero(),v),初始值和第一个key的value值进行分区内操作
cleanedSeqOp,//分区内计算规则
combOp, 分区间计算规则
)
reduceByKey
combineBYKeyWithCalssTag[V](
(v:V)=>v,//第一个值不会参与计算
func,//分区内计算规则
func,//分区间计算规则
)