
大数据之SparkCore
定义: 弹性 分布式 数据集理解: 分布式的列表本质:一个分布式的逻辑的概念,物理上代表多台节点上的多个分区的数据一个抽象的逻辑上的数据集合的概念,类似于Python中的list, 但RDD是分布式的Python中的list:数据只存在于list构建的节点Spark中的RDD:数据是分布式存储在多台节点上的功能:用于SparkCore中构建分布式数据对象,实现分布式数据的存储,实现分布式的数据存储,是一个对应多个物理分区的数据集合,每个分区的数据可以存储在不同的节点上。





