因为他是确保可以存储在单个节点上的最大输入快的大小,如果分片跨越两个数据块,对于任何一个hdfs节点,基本上不可能同时存储这两个数据块,因此分片中的部分数据需要通过网络传输到map任务运行的节点上
转载于:https://my.oschina.net/u/4009325/blog/2396143
因为他是确保可以存储在单个节点上的最大输入快的大小,如果分片跨越两个数据块,对于任何一个hdfs节点,基本上不可能同时存储这两个数据块,因此分片中的部分数据需要通过网络传输到map任务运行的节点上
转载于:https://my.oschina.net/u/4009325/blog/2396143