RDD简介,spark-shell,spark-submit提交任务简单示例
RDD简介,spark-shell,spark-submit提交任务简单示例spark RDD简介弹性分布式数据集RDD是Spark框架中的核心概念。可以将RDD视作数据库中的一张表。其中可以保存任何类型的数据。Spark将数据存储在不同分区上的RDD之中。RDD可以帮助重新安排计算并优化数据处理过程。RDD具有容错性,因为RDD知道如何重新创建和重新计算数据集。RDD是不可变的。你...
原创
2019-01-06 20:23:15 ·
2155 阅读 ·
1 评论