定义(1);block;
HDFS存储数据在DataNode节点,block就是DataNode里存储数据的一个一个单位。当我们把文件上传到HDFS时,文件会被分块,这个是真实物理上的定义。
定义(2);split;
Split是逻辑意义上的定义。split是把block切分而成的虚拟上的的定义,是MapReduce里的概念。
总结
1. split是MapReduce里的切片的概念,split是虚拟切片 ;而block是hdfs中切块的大小,block是物理切块;
HDFS存储数据在DataNode节点,block就是DataNode里存储数据的一个一个单位。当我们把文件上传到HDFS时,文件会被分块,这个是真实物理上的定义。
Split是逻辑意义上的定义。split是把block切分而成的虚拟上的的定义,是MapReduce里的概念。
1. split是MapReduce里的切片的概念,split是虚拟切片 ;而block是hdfs中切块的大小,block是物理切块;