HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数
( dfs.blocksize)来规定,默认大小在Hadoop2.x/3.x版本中是128M,1.x版本中是64M。
1.HDFS的块设置太小,会增加寻址时间,程序一直在找块的开始位置
2.如果块设置的太大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。导致程序在处理这块数据时,会非常慢
HDFS的大小设置主要取决于磁盘传输速率(一般公司128M,大公司256M)
HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数
( dfs.blocksize)来规定,默认大小在Hadoop2.x/3.x版本中是128M,1.x版本中是64M。
1.HDFS的块设置太小,会增加寻址时间,程序一直在找块的开始位置
2.如果块设置的太大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。导致程序在处理这块数据时,会非常慢
HDFS的大小设置主要取决于磁盘传输速率(一般公司128M,大公司256M)