一、数据冗余的的目的
保证数据安全
二、数据冗余的思路
每个文件都会有多个副本分散在不同的DataNode上,NameNode时刻监视文件的副本量,如果小于设定的值就找一台DataNode增加副本数。
三、向HDFS写数据的过程
- 客户端先向NameNode发出创建文件的请求
- NameNode告诉它应该将文件放在哪个DataNode上
- 客户端连接那个DataNode,再向它发送要写的数据
- DataNode收到数据后保存数据,同时将数据副本放到其他DataNode上
- 当所有副本写完,才通知NameNode一次写操作完成