学习spark的网站地址:真心不错
https://www.cnblogs.com/qingyunzong/p/8899715.html
https://www.cnblogs.com/qingyunzong/category/1202252.html
如下:
目录
一、RDD的概述
1.1 什么是RDD?
1.2 RDD的属性
1.3 WordCount粗图解RDD
二、RDD的创建方式
2.1 通过读取文件生成的
2.2 通过并行化的方式创建RDD
2.3 其他方式
三、RDD编程API
3.1 Transformation
3.2 Action
3.3 Spark WordCount代码编写
3.4 WordCount执行过程图
四、RDD的宽依赖和窄依赖
4.1 RDD依赖关系的本质内幕
4.2 依赖关系下的数据流视图