一、常用transformation介绍
操作 | 介绍 |
---|---|
map | 将RDD中的每个元素传入自定义函数,获取一个新的元素,然后用新的元素组成新的RDD |
filter | 对RDD中每个元素进行判断,如果返回true则保留,返回false则剔除 |
flatMap | 与map类似,但是对每个元素都可以返回一个或多个新元素 |
groupByKey | 根据key进行分组,每个key对应一个Iterable<value> |
reduceByKey | 对每个Key对应的value进行reduce操作 |
sortByKey | 对每个key对应的value进行排序操作 |
join | 对两个包含<key,value>的RDD进行join操作,每个key join上的pair,都会传入自定义函数进行处理 |
cogroup | 同join,但是每个key对应的Itreable<value>都会传入自定义函数进行处理 |
union、intersection、subtract、combineByKey、foldByKey |