【读书笔记】spark快速数据分析(持续更新...)
文章目录spark核心概念RDD编程RDD支持的操作RDD持久化方式RDD的创建RDD伪集合操作向spark传参RDD常见操作RDD持久化PairRDD 转换操作spark常见问题数据倾斜
spark核心概念
drive program 驱动器程序
当我们使用spark shell时,我们已经拥有了一个实际的驱动器即spark shell本身
连接对象 SparkContext
一个spar...
原创
2018-10-18 13:17:55 ·
358 阅读 ·
0 评论