1.
-
使用
parallelize()
方法创建RDD时,可以传入第二个参数,指定分区数量。 -
注意:采用本地模式启动Spark Shell(在master节点上)
-
2.利用mapPartitionsWithIndex()
函数实现带分区索引的映射
3.
4.
5.
6.
7.
8.
1.
使用parallelize()
方法创建RDD时,可以传入第二个参数,指定分区数量。
注意:采用本地模式启动Spark Shell(在master节点上)
2.利用mapPartitionsWithIndex()
函数实现带分区索引的映射
3.
4.
5.
6.
7.
8.