一
首先连接集群 ,进入Spark客户端
在 bin 目录下
./spark-shell --master spark://linux01:7077
二
我们可以通过一个集合来创建 RDD
val arr=Array(1,2,3,4,5
本文介绍了如何连接到Spark集群并使用bin目录下的工具创建RDD。通过集合并行化的方式,可以将数据转化为Spark的弹性分布式数据集。
一
首先连接集群 ,进入Spark客户端
在 bin 目录下
./spark-shell --master spark://linux01:7077
二
我们可以通过一个集合来创建 RDD
val arr=Array(1,2,3,4,5
610
281
1613
5380
2770

被折叠的 条评论
为什么被折叠?