//输出的是0 1 因为 ""和 "12" "23"比较最小的是0,而这个结果返回的是0,0.toString之后长度为1了,所以第一个分区的值应该是1,
// 1和"333"的长度比较,最小的是1,又和""比较,最小的是0 所以最后输出的是0 1
val rdd5 = sc.parallelize(List("12","23","333",""),2)
//输出的是1 1 因为 ""和 "12" "23"最小的是"",第一次比较,最小的长度是"",他的长度是0,0.toString之后变成了1,1和"23".length比 最小的还是1,
// 之后""和""比最小的是0,0.toString是1,所以在和"333"比的时候仍然为1
val rdd6 = sc.parallelize(List("12","23","","333"),2)
而
val rdd4 = sc.parallelize(List(12,25,33,16),2)
println(rdd4.aggregate(10)((x,y)=>math.max(x,y),(x,y)=>x+y))
得到的结果是25+33+10
其实底层原理不是把zeroValue也当成一个分区看待,应该是在最后结果出来以后,在将0值和得到的值进行这个运算,如果是(x,y)=>x*y 那最后的值就是8250
而
val rdd4 = sc.parallelize(List(12,25,33,16),2)
println(rdd4.aggregate(10)((x,y)=>math.max(x,y),(x,y)=>x+y))
得到的结果是25+33+10
其实底层原理不是把zeroValue也当成一个分区看待,应该是在最后结果出来以后,在将0值和得到的值进行这个运算,如果是(x,y)=>x*y 那最后的值就是8250