HDFS 分布式文件系统
1)NameNode(nn):存储文件的元数据,如文件名、文件目录结构、文件属性,以及每个文件的块列表和块所在的DataNode等。
2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。
3)Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份
YARN Hadoop的资源管理器
1)ResourceManager(RM):资源管理器。管理整个集群资源
2)NodeManager(NM):节点管理器。管理单个节点服务器资源
3)ApplicationManager(AM):管理单个任务运行
4)Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、CPU、磁盘、网络等
注:1客户端可以有多个
2集群上可以运行多个Application
3每个NodeManager上可以有多个Container