上文我们学习到,Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS,那这个HDFS到底是做什么的,用什么来实现的呢?本文我们来一起学习下!
一、HDFS系统架构
HDFS采用了master/slave的架构,即主从复制机制,其中Master以写为主,Slave以读为主。
要学习HDFS,必须了解如下组件(参照图1):(重点已经标黑,便于记忆和理解)
NameNode:说白了就是负责系统文件的命名和文件和目录维护,以namespcae image和edit log两个文件形式永久保存在本地磁盘上<