通过scala集合以并行化方式创建一个RDD
scala> val pairRdd = sc.parallelize(List(("cat",2),("cat",5),("mouse",4),("cat",12),("dog",12),("mouse",2)),2)
pairRdd 这个RDD有两个区,一个区中存放的是:
("cat",2),("cat",
通过scala集合以并行化方式创建一个RDD
scala> val pairRdd = sc.parallelize(List(("cat",2),("cat",5),("mouse",4),("cat",12),("dog",12),("mouse",2)),2)
pairRdd 这个RDD有两个区,一个区中存放的是:
("cat",2),("cat",