- 博客(1)
- 收藏
- 关注
原创 Spark RDD简介与操作
在Spark中,RDD可以看作是一个对象,它本身运行于内存中,如读文件是一个RDD,对文件计算是一个RDD,结果集也是一个RDD。在Spark中,RDD可以看作是一个对象,它本身运行于内存中,可以用于读文件、对文件计算、结果集等操作。在Spark中,RDD是一个并行集合,它包含多个分片,每个分片可以在不同的计算节点上并行处理。然后,我们对RDD进行转换和计算操作,并输出结果。在Scala中,Spark的RDD API提供了许多转换操作(transformations),用于对RDD进行转换和计算。
2023-08-01 17:10:52 519 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人