Spark (Python版) 零基础学习笔记(四)—— Spark概览
结合了《Learning Spark: Lightning-Fast Big Data Analysis》和官方2.02版本的Spark Document总结了关于Spark概念性的一些知识。帮助大家对Spark有一个总体上的认知一、Spark的两个核心概念:
RDD:弹性分布式数据集
Shared variables:共享变量
二、Spark组件:Spark集成了很多组件。Spark的内核是一个计
原创
2016-11-23 08:48:23 ·
2946 阅读 ·
0 评论