1.要知道到底要管理哪些机器节点,即知道到底有哪些datanode
2.管理文件信息,包含文件名,文件大小,文件被切成几块,以及文件被存放在哪个datanode节点上,概念来讲就是需要管理元数据信息
3.需要一个机制来知道集群里面datanode几点的状态变化,比如使用rpc心跳机制
4.namenode存在单点故障问题,可以再引入一台管理者节点
5.datanode挂掉后,数据会丢失,所以还需要引入一个备份的机制,一般来讲一个文件块有三个备份,本机,同一机架的其他datanode,另外一台机器上各有一份
namenode工作模式
最新推荐文章于 2019-06-10 21:26:38 发布