一、窄依赖(narrow dependencies)
1、子RDD的每个分区依赖于常数个父分区(既与数据规模无关)
2、输入输出一对一的算子,且结果RDD的每个分区结构不变,主要是map、flatMap
3、输入输出一对一,但结果RDD的结构发生了变化,如union、coalesce
4、从输入中选择部分元素的算子,如filter、distinct、subtract、sample
二、宽依赖(wide dependencies)
1、子RDD的每个分区依赖于所有父RDD分区
2、对单个RDD基于key进行重组和reduce,如groupByKey、reduceByKey
3、对两个RDD基于key进行join和重组,如join