leftOuterJoin()、join()、intersection()
leftOuterJoin() 与pandas中的merge() 外连接方法功能相似。根据两个RDD中都有的值来连接,并返回RDD记录。当然这也是一个高开销的方法,需要谨慎使用。
join()与内连接方法相似、intersection()查找两个RDD相等的元素。
rdd1 = sc.parallelize([('a', 1), ('b', 2), ('c', 3)])
rdd2 = sc.parallelize([('a', 1),