MapRedute 实现k-means聚类
while (Iteration++ < 10) {
RUN a JOB ==>
Map函数
完成每个记录到聚类中心距离的计算并重新标记其属于的新聚类类别
假设该记录record到中心点A[k] 的距离是最短的,则
Emit(a[k], record);
Reduce函数
根据Map函数得到的中间结果计算出新的聚类中心,供下一轮MapReduce迭代使用
每个reduce函数处理分到一个中心点 a[k] 的所有记录,由这些记录生成一个新的中心点 b[k]
Emit(b[k], record);
}