HDFS文件副本机制:
所有的文件都是以block快的方式存放在HDFS文件系统当中,作用如下:
- 一个文件有可能大于集群中任意一个磁盘,引入 块机制,可以很好的解决这个问题
- 使用块作为文件存储的逻辑单位可以简化存储子系统
- 块非常适合用于数据备份进而提供数据容错能力
- Hadoop1当中,文件的block快默认大小是64M,hadoop2当中,文件的block块大小默认是128M,block块的大小可以通过hdfs-site.xml当中的配置文件进行指定。
<property>
<name>dfs.block.size</name>
<value>块大小 以字节为单位</value>
</property>
机架感知:
hdfs分布式文件系统的内部有一个副本存放策略:以默认的副本数=3为例:
- 第一个副本块存本机
- 第二个副本块存跟本机同机架内的其他服务器节点
- 第三个副本块存不同机架的服务器节点上