知识点说明:
在hdfs当中,会讲文件以块为单位进行划分。
1,hdfs 的默认块大小是128M(hdfs2)
hdfs1 中默认块的大小是64m
块的大小可以自定义。
2 ,块是如何占磁盘空间的?
先从头切128M的块,后面小于128按实际大小来存储。
3,在hdfs 中 dn节点主要干的事情是:储存所有的块信息。
注意: 一台服务器只允许有一个dn
4,为了保证数据的完整性,那以在hdfs当中会采用副本机制来进行处理(hdfs副本是包含本身)
副本之间是通过dn与dn之间的数据传输
5,当我们在获取一个文件的时候,只知道文件的名称,据他有哪些块用户是不知道的,所以就存在一个管理这些块信息的节点NN,NN也被称为主节点。
在默认的结构中,不管服务器有多少台,NN只有一个。
故障问题;
在实际生产的过程中,硬件出现故障的可能性是非常大的。
如果是dn挂掉了: NN会将挂掉的数据转移到其他主机中。
NN如