按Key进行分组,
输入 List(("A",1),("B",2),("A",2),("B",3))
输出
(B,(2, 3))
(A,(1, 2))
然后对key进行个数统计
# (A,2)
# (B,2)
//省略
val arr = List(("A",1),("B",2),("A",2),("B",3))
val rdd = sc.parallelize(arr)
val groupByKeyRDD = rdd.groupByKey()
groupByKeyRDD.foreach(println)
sc.stop
# (B,CompactBuffer(2, 3))
# (A,CompactBuffer(1, 2))
# 统计key后面的数组汇总元