namenode重启的时候会通过这两个文件恢复:
fsimage 内存中的镜像文件
edits 日志文件
namenode(master)存储时间、大小、权限、块列表
node结点存储分块文件
如下图所示:
namenode决定第一个副本存储在哪一个主机,第二个副本存储在哪一个主机……
心跳机制:告诉namenode,datanode还活着,就是定期给namenode发送一个消息。如果datanode(node01)挂机了,这个时候namenode会将其存储的block再复制一份存储在其他datanode。
块缓存:例如node01上缓存褐色的小block,namenode(node01)就会定期发送缓存信息(这里就是小褐色block)给datanode
副本机制和机架感知
一个block默认是128M。可以通过etc下的hadoop种hdfs-site.xml可以设置一个文件切片的大小