HDFS全称 Hadoop Distribute File System 即 Hadoop分布式文件系统 主要作用:即存储海量数据。为什么能存储海量数据? 因为其空间大,空间大的原因为服务器多、磁盘多。且支持扩展组成部分: 管理者-Master NameNode 集群中有1-2个,用于管理集群中的工作者工作者-Slave DataNode 集群中有多个,真正存储和计算数据组件辅助管理 SecondaryNameNode 辅助管理者工作