HDFS块大小 前言: HDFS文件在物理上是分块(Blokc)存储,块的大小可以使用配置参数dsf.blocksize来规定,默认Hadoop3.x 版本是128M 块大小设置原则: 寻址时间为传输时间的1%为最佳状态。 因此我们需要根据磁盘传输速率来设置块的大小! 块不能设置太小或者太大: 1、HDFS的块设置太小,会产生太多块,导致元数据信息大量增加,从而使得寻址时间增加。 2、块设置过大,从磁盘传输数据的时间会明显远大于定位这个块开始位置所需的时间,导致程序处理这段数据时,非常慢!!