rdd基本操作
rdd基本操作
为该内容的学习记录。
https://blog.csdn.net/qq_41455420/article/details/79462653
代码片中,scala>开头的是输入的代码,res的为结果
1、spark启动
spark-shell
2、生成一个rdd
val a = sc.parallelize(1 to 9, 3)
# 创建一个a,内容是123456789,分成三个分区
#查看a:
a.collect
#按分区查看a:
a.glom().collect
3、map
s
转载
2021-08-17 15:17:08 ·
433 阅读 ·
0 评论