NodeManager专区-NodeManager的基本特性和概述

NodeManager是Hadoop YARN框架中的关键组件,作为集群中每个节点的代理,负责与ResourceManager和ApplicationMaster交互。它管理container的生命周期,监控资源使用,报告节点健康状态。NodeManager通过ResourceTrackerProtocol与ResourceManager通信,注册节点,接收container命令,通过ContainerManagermentProtocol与ApplicationMaster交互,启动和停止container。NodeManager架构包括NodeStatusUpdater、ContainerManager等多个组件,确保资源的有效管理和节点健康检查。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概述

       NodeManager是运行在单个节点上的代理,它需要与应用程序的ApplicationMaster和集群的管理节点ResourceManager交互:从ApplicationMaster上接收有关的container的命令并执行;向ResourceMansger汇报各个container运行状态和节点健康状况,并领取有关container的命令执行

       NodeManager是yarn中单个节点上的代理,它管理hadoop集群中单个计算节点,功能包括与ResourceManager保持通信、管理container和生命周期、监控每个container的资源使用情况、追踪节点健康状况、管理日志和不同应用程序用到的附属服务。

NodeManager职能

1、ResourceTrackerProtocol协议
       NodeManager通过该RPC协议向ResourceManager注册、汇报节点健康状况和container运行状况,并领取ResourceManager下达的命令,包括重新初始化、清理container占用资源等。在该RPC协议中,ResourceManager扮演RPC Server的角色,而NodeManager扮演PRC
client的角色,NodeManager总是周期性的主动向ResourceManager发送请求,并领取下达给自己的命令。ResourceTrackerProtocol协议主要提供了以下2个RPC函数

registerNodeManager
       NodeManager启动时通过该RPC函数向ResourceManager注册,注册信息由register-NodeManagerRequest封装的,包括3部分

  • httpPort: 该NodeManager对外提供的HTTP端口号,ResourceManager会在界面上提供一个可直接访问NodeManager web界面的超链接
  • NodeId: 该NodeManager所在的host和对外的RPC端口号
  • totalResource: 该NodeManager所在节点总的可分配资源,当前支持内存和虚拟CPU两种资源,管理员可通过参数yarn.nodemanager.resource.cpu-vcores和yarn.nodemanager.resource.memory-mb还可以通过参数yarn.nodemanager.vmem-pmem-ratio设置物理内存和虚拟内存使用比率,默认是2.1,即每使用1MB物理内存,最多可以使用2.1MB虚拟内存

       ResourceManager将还通过registerNodeManager函数向NodeManager返回一个Resister-NodeManagerResponse类型的对象,主要包含以下信息:

  • MasterKey: 新生成的container Token和Node Token的Master Key
  • NodeAction: ResourceManager向该NodeManager返回的下一步操作,主要包含NORMAL、RESYNC和SHUTDOWN三种,分别表示正常、重新同步信
配置Hadoop YARN集群是非安全模式下确保集群高效运行的关键步骤。为了解决您当前的问题,建议参考《Hadoop YARN集群配置详解》这份资源。该文档详细介绍了YARN的配置流程,并解释了各个配置文件的作用,以及如何设置相关参数来确保ResourceManagerNodeManager的正常工作。以下是配置步骤关键配置项的概述: 参考资源链接:[Hadoop YARN集群配置详解](https://wenku.csdn.net/doc/7va6meqwne?spm=1055.2569.3001.10343) 首先,您需要对集群中的所有节点进行操作系统级别的配置,比如主机名解析、SSH免密登录、时间同步等,以保证集群节点间能够无障碍通信协作。 接下来,您需要在`core-site.xml`中配置Hadoop的核心参数,包括文件系统的默认名称(fs.defaultFS)Hadoop的临时目录(hadoop.tmp.dir)。 在`hdfs-site.xml`中,您需要配置HDFS的副本数量(dfs.replication),以及其他与HDFS相关的重要参数。 最重要的是在`yarn-site.xml`中设置YARN的配置项。这里需要指定YARN资源管理器的地址(yarn.resourcemanager.address),YARN节点管理器的资源类型服务(yarn.nodemanager.aux-services),以及资源管理器的调度器类(yarn.resourcemanager.scheduler.class)等。 完成配置后,需要在所有节点上解压Hadoop安装包,并配置环境变量,比如HADOOP_HOMEPATH。然后在NameNodeResourceManager节点上启动YARNHDFS服务。 当ResourceManagerNodeManager启动后,您可以通过访问ResourceManager的Web界面(默认端口8088)来监控集群的状态资源使用情况。 以上步骤涵盖了在非安全模式下配置Hadoop YARN集群的核心操作。若需要进一步了解如何在安全模式下配置YARN,或者深入学习YARN的其他高级特性,可以继续参考《Hadoop YARN集群配置详解》,该资料将为您提供更全面的技术细节支持。 参考资源链接:[Hadoop YARN集群配置详解](https://wenku.csdn.net/doc/7va6meqwne?spm=1055.2569.3001.10343)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值