**************************************
1、aggregate,第一个为初始值,第二个为element类型,第三个为返回值,其中第一个和第三个可以为自定义类型
如同时返回元素的和与元素的个数,第一个值需要传入初始化的一个自定义对象
Double distenceAccount = sequencesRDD.aggregate(0.0, new Function2<Double, SequenceForCalc, Double>() {
@Override
public Double call(Double v1, SequenceForCalc v2) throws Exception {
v1 += v2.getDistanceOfSequence();
return v1;
}
}, new Function2<Double, Double, Double>() {
@Override
public Double call(Double v1, Double v2) throws Exception {
v1 += v2;
return v1;
}
});
double distencePerPartition = distenceAccount/numSlices;
************************************************************
2、mapToPair
JavaPairRDD<SequenceForCalc, Integer> rddKeyVal =
sequencesRDD.mapToPair(new PairFunction<SequenceForCalc, SequenceForCalc, Integer>(){
@Override
public Tuple2<SequenceF
1、aggregate,第一个为初始值,第二个为element类型,第三个为返回值,其中第一个和第三个可以为自定义类型
如同时返回元素的和与元素的个数,第一个值需要传入初始化的一个自定义对象
Double distenceAccount = sequencesRDD.aggregate(0.0, new Function2<Double, SequenceForCalc, Double>() {
@Override
public Double call(Double v1, SequenceForCalc v2) throws Exception {
v1 += v2.getDistanceOfSequence();
return v1;
}
}, new Function2<Double, Double, Double>() {
@Override
public Double call(Double v1, Double v2) throws Exception {
v1 += v2;
return v1;
}
});
double distencePerPartition = distenceAccount/numSlices;
************************************************************
2、mapToPair
JavaPairRDD<SequenceForCalc, Integer> rddKeyVal =
sequencesRDD.mapToPair(new PairFunction<SequenceForCalc, SequenceForCalc, Integer>(){
@Override
public Tuple2<SequenceF