晚上找了半天,总结一下网上的资源: 先上图: 每一个过程的任务数,对应一个inputSplit1, Partition 输入可能以多个文件的形式存储在HDFS上,每个File都包含了很多块,称为Block