在 Spark 中,可以使用 SparkContext 来创建 RDD 或 DataFrame。
创建 RDD 的方法是:
val sc = new SparkContext(conf)
val data = Array(1, 2, 3, 4, 5)
val rdd = sc.parallelize(data)
在 Spark 中,可以使用 SparkContext 来创建 RDD 或 DataFrame。
创建 RDD 的方法是:
val sc = new SparkContext(conf)
val data = Array(1, 2, 3, 4, 5)
val rdd = sc.parallelize(data)