版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Suubyy/article/details/81190460
- 窄依赖
- 定义:窄依赖英文为
Narrow Dependency
。在Spark中,我们具体操作的是RDD
数据,而RDD
是由多个Partition
组成的,所以实际上我们真正操作的是Partition
上的数据。当我们操作Partition
上的数据的时候无非是两种情况,一种是Translation
和Action
、这两种操作都会有一个RDD
产生另一个RDD
,我们管前一个RDD
叫做父RDD
,管后一个RDD
叫子RDD
,在执行操作的时候,如果子RDD
中的每个Partition
中的数据与父RDD
中的其中的一个Partition
的数据转换或者操作而来的,他们是一一对应的关系,那么我们就管这种依赖关系叫做窄依赖 - 图解:
- 定义:窄依赖英文为
- 款依赖
- 定义:窄依赖英文为
Narrow Dependency
。在Spark中,我们具体操作的是RDD
数据,而RDD
是由多个Partition
组成的,所以实际上我们真正操作的是Partition
上的数据。当我们操作Partition
上的数据的时候无非是两种情况,一种是Translation
和Action
、这两种操作都会有一个RDD
产生另一个RDD
,我们管前一个RDD
叫做父RDD
,管后一个RDD
叫子RDD
,在执行操作的时候,如果子RDD
中的每个Partition
的数据是由父RDD
中的多个Partition
中的一部分数据转换或者操作而来的,他们是多对多的对应的关系,那么我们就管这种依赖关系叫做宽依赖 - 图解:
- 定义:窄依赖英文为