1. block是物理上的数据分割,而split是逻辑上的分割。
2.Block 非常适合用于数据备份,进而提供数据容错能力和可用性,split不具备。
3. 一个split不会包含零点几或者几点几个Block,一定是包含大于等于1个整数个Block。
4. split和Block的关系是一对多的关系。
5. map tasks的个数是由splits的长度决定的。
1. block是物理上的数据分割,而split是逻辑上的分割。
2.Block 非常适合用于数据备份,进而提供数据容错能力和可用性,split不具备。
3. 一个split不会包含零点几或者几点几个Block,一定是包含大于等于1个整数个Block。
4. split和Block的关系是一对多的关系。
5. map tasks的个数是由splits的长度决定的。