文章地址:http://www.haha174.top/article/details/256658
根据hello world 的例子介绍一个什么是宽依赖和窄依赖。
窄依赖:英文全名,Narrow Dependence.什么样的情况,叫做窄依赖呢?一个RDD对他的父RDD只有简单的1对1的依赖关系。也即是说。RDD的每个partition.仅仅依赖于父RDD中的一个partition。父RDD和子RDD的关系是一对一的如图
宽依赖:英文全名 Shuffle Dependence 每一个父类的RDD都可能传输一部分到下一个RDD的每个partition中。此时就会出现父子RDD之间错综复杂的关系。那么这种情况称为两个RDD之间的宽依赖。同时他们之间的操作也是shuffle.