HDFS block是数据的物理表示,而Split是block中数据的逻辑表示。一般,split size就等于HDFS的block size。一个split可以包含多个blocks,也可以把一个block应用多个split操作。