一、键值对RDD的创建
1、从文件中加载生成RDD
2、通过并行集合(数组)创建RDD
二、常用的键值对转换操作
reduceByKey(func) | groupByKey() | keys | values |
sortByKey()、sortBy() | mapValues(func) | join | combineByKey |
(1)、reduceByKey(func)
功能是:使用func函数合并具有相同键的值。
reduceByKey对每个key对应的多个value进行聚合操作,通过func自定义函数。