1.split是逻辑切片,是MapReduce里切片的概念,
block是物理切片,是HDFS中切片的大小
2.split的大小默认下等于block的大小
3.block:文件被上传到HDFS是,会被分块,这是真实的物理上的划分,每块的大小可以设 split:他是逻辑意义上的split,用户根据自己处理的数据量的情况,自行设置
4.split和block是一对多的关系
1.当程序读取block0时,可以完整的读到第五行的完整数据
2.block1的第四行数据被丢弃,直接从第五行读取
1.split是逻辑切片,是MapReduce里切片的概念,
block是物理切片,是HDFS中切片的大小
2.split的大小默认下等于block的大小
3.block:文件被上传到HDFS是,会被分块,这是真实的物理上的划分,每块的大小可以设 split:他是逻辑意义上的split,用户根据自己处理的数据量的情况,自行设置
4.split和block是一对多的关系
1.当程序读取block0时,可以完整的读到第五行的完整数据
2.block1的第四行数据被丢弃,直接从第五行读取