1 文件大小可以大于任意一个磁盘的容量,块并不需要存储在同一个磁盘上
2 抽象块作为存储单元,简化存储子系统的设计
1) datanode将块作为处理对象,能存储多少块也能计算出
2) namenode管理元数据
3 数据备份提高容错能力和可用性
HDFS块为什么这么大?
最小化寻址开销
块足够大时,磁盘传输速率会远远大于寻址时间,则传输时间更依赖于磁盘传输速率
1 文件大小可以大于任意一个磁盘的容量,块并不需要存储在同一个磁盘上
2 抽象块作为存储单元,简化存储子系统的设计
1) datanode将块作为处理对象,能存储多少块也能计算出
2) namenode管理元数据
3 数据备份提高容错能力和可用性
HDFS块为什么这么大?
最小化寻址开销
块足够大时,磁盘传输速率会远远大于寻址时间,则传输时间更依赖于磁盘传输速率