1:简述HDFS的特点以及优点缺点。
HDFS的优点
(1)支持超大文件的存储;
(2)支持流式文件访问。
(3)运行于廉价的商用机器集群。
HDFS的缺点
(1)不适合低延迟数据访问;
(2)无法高效存储大量小文件;
(3)不支持多用户写入及任意修改文件。
2:简述NameNode,DataNode,Secondary NameNode之间的关系。
DataNode根据NameNode的指令创建、删除和复制数据块;
NameNode需要保持文件系统最新的元数据,SecondaryNameNode就是合并NameNode的edit logs到fsimage文件中。
Secondary NameNode所做的是在文件系统中设置一个检查点来辅助NameNode更好的工作。所以Secondary NameNode称为检查点节点。
3:简述HDFS读写文件的基本原理。
读文件:
1、客户端向NameNode发出写文件请求;
2、并通过NameNode获得组成该文件的数据块位置列表;
3、然后客户端直接从这些DataNode读取文件数据;
写文件:
1、向NameNode发送数据写操作请求,包括文件名和目录路径等部分元数据信息;
7、NameNode告诉客户机端到那个Rack的哪个DataNode进行具体的数据写入;
8、客户端直接将文件数据传输给DataNode。
ps:在读写过程中,NameNode均不参加文件的传输。