NameNode:集群的管理,存储元数据(描述数据的数据)信息 一个 DataNode:存储真实数据的节点 多个 SecondaryNameNode:辅助NN的辅助节点 一个 YARN集群负责海量数据运算时的资源调度,集群中的角色主要有: CPU 内存 磁盘 网络带宽