hdfs设计
建立思想在:一次写入、多次读取的模式
为什么设计块
1.简化存储子系统,容错性和实用性比较高;
2.一个文件可以大于网络任何一个磁盘的容量。把文件分块,文件就不需要存储在同一个磁盘里面了。
namenode和datanode
hdfs是管理者和工作者的设计模式。
namenode管理的是文件系统的命名空间,包括文件系统树、以及这个树内所有的文件和索引目录。以两种形式存储在本地磁盘:editlog(编辑日志)和fsimage(命名空间镜像)。
datanode是工作者:存储并提供定位块的服务(被调用时),并且定时向名称节点发送它们存储的块的列表。
namenode要是坏了的话,就没办法知道文件是由哪些节点组成,所以要有容错机制。(secondrynamenode)