一、数据冗余的的目的 保证数据安全 二、数据冗余的思路 每个文件都会有多个副本分散在不同的DataNode上,NameNode时刻监视文件的副本量,如果小于设定的值就找一台DataNode增加副本数。 三、向HDFS写数据的过程 客户端先向NameNode发出创建文件的请求NameNode告诉它应该将文件放在哪个DataNode上客户端连接那个DataNode,再向它发送要写的数据DataNode收到数据后保存数据,同时将数据副本放到其他DataNode上当所有副本写完,才通知NameNode一次写操作完成