1. NameNode和dataNode的区别
Namenode是分布式文件系统的管理者,管理文件系统命名空间。集群配置信息和存储快的复制等,同时会将Meta-data存储在内存中。
DataNode是文件存储的基本单元,将block存储在本地文件系统中,存储了Meta-data,会周期性的将所有Block信息发送给NameNode。
2. 文件写入
client向NameNode发起文件写入请求
NameNode根据文件大小和文件快配置情况,返回给client所管理的DataNode信息
client根据这些DataNode进行写入
3 文件读取
client向NameNode发起文件读取的请求
NameNode返回DataNode信息
client读取文件信息。