一、什么是HDFS
HDFS(Hadoop Distributed File System),简称HDFS,是一个分布式文件系统。
二、HDFS组成
1、NameNode(简称NN)
存储文件的元数据,如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
nameNode相当于mysql里的索引。
2、DataNode(简称DN)
在本地文件系统存储文件块数据,以及块数据的校验和。
3、Secondary NameNode(简称2NN)
每隔一段时间对NameNode元数据备份。