union()
union将包含两个rdd中的所有元素
rddA.union(rddB)
distinct()
distinct会去掉一个rdd中重复的元素
rddA.distinct()
interaction()
交集:返回两个rdd所共有的元素
rddA.interaction(rddB)
subtract()
取子集:返回只存在rddA中不存在rddB中的元素
rddA.subtract(rddB)
union()
union将包含两个rdd中的所有元素
rddA.union(rddB)
distinct()
distinct会去掉一个rdd中重复的元素
rddA.distinct()
interaction()
交集:返回两个rdd所共有的元素
rddA.interaction(rddB)
subtract()
取子集:返回只存在rddA中不存在rddB中的元素
rddA.subtract(rddB)