一个NameNode对应多个DataNode,前者负责统一调度一个文件Data被拆分为多个Block,每个Block数据交给一个Map任务受理将上一步的结果按Hash(Key) mod R合并到不同的数据集中(R为自定义的Reduce个数)Reduce任务一对一受理上一步的数据集 ps:本文纯属个人业余总结,如有准确,纯属巧合