Shuffle机制
map方法之后,reduce之前的数据处理过程叫shuffle(洗牌)
分区
Partition分区:
默认分区是根据key的hashCode对ReduceTasks个数取模得到的,用户没法控制哪个key存储到哪个分区。
Shuffle机制
map方法之后,reduce之前的数据处理过程叫shuffle(洗牌)
分区
Partition分区:
默认分区是根据key的hashCode对ReduceTasks个数取模得到的,用户没法控制哪个key存储到哪个分区。