一、RDD编程模型
![](https://img-blog.csdnimg.cn/img_convert/de94a91ed2789670cf7d6c2ae1b5672e.png)
### --- RDD编程模型
~~~ RDD表示数据对象
~~~ 通过对象上的方法调用来对RDD进行转换
~~~ 最终显示结果 或 将结果输出到外部数据源
~~~ RDD转换算子称为Transformation是Lazy的(延迟执行)
~~~ 只有遇到Action算子,才会执行RDD的转换操作
### --- 要使用Spark,需要编写 Driver 程序,它被提交到集群运行
~~~ Driver中定义了一个或多个 RDD ,并调用 RDD 上的各种算子
~~~ Worker则执行RDD分区计算任务
![](https://img-blog.csdnimg.cn/img_convert/031ca645eef3668a2fe6274352416102.png)