一、subtractByKey
函数定义
def subtractByKey[W](other: RDD[(K, W)])(implicit arg0: ClassTag[W]): RDD[(K, V)]
def subtractByKey[W](other: RDD[(K, W)], numPartitions: Int)(implicit arg0: ClassTag[W]): RDD[(K, V)]
def subtractByKey[W](other: RDD[(K, W)], p: Partitioner)(implicit arg0: ClassTag[W]): RDD[(K, V)]
类似于subtrac,删除RDD中键与other RDD中的键相同的元素
二、join
函数定义
def join[W](other: RDD[(K, W)]): RDD[(K, (V, W))]
def join[W](other: RDD[(K, W)], numPartitions: Int): RDD[(K, (V, W))]
def join[W](other: RDD[(K, W)], partitioner: Partitioner): RDD[(K, (V, W))]
RDD1 join(RDD2) 可以把RDD1、RDD2中的相同的key给连接起来,类似于SQL中的join操作
三、fullOuterJoin
和join类似,不过这是全连接
四、leftOuterJoin
函数定义
def leftOuterJoin[W](other: RDD