[Spark RDD转换操作运算子]
Spark RDD转换操作
RDD,即弹性分布式数据集,全称为Resilient Distributed Dataset,是一个容错的,并行的数据结构,可以让用户显式地 将数据存储到磁盘和内存中,并能控制数据的分区。同时,RDD还提供了一组非常丰富的操作来操作这些数据,如:map,flatMap,filter等转换操作,以及SaveAsTextFile,conutByKey等行动操作。
本博客中...
原创
2018-07-24 23:30:57 ·
7188 阅读 ·
0 评论