yarn pending

77惨惨77

于 2024-08-26 03:22:02 发布

阅读量13

点赞数

我整理的一些关于【CI】的项目学习资料（附讲解～～）和大家一起分享、学习一下：

https://edu.51cto.com/mic-position/757.html

理解 Yarn Pending 状态及其处理

Yarn（Yet Another Resource Negotiator）是 Hadoop 生态系统中的一个组件，用于管理和调度计算资源。在使用 Yarn 进行分布式计算时，我们可能会遇到“pending”状态，这意味着应用程序的某些任务由于资源不足而无法启动。本文将探讨 Yarn Pending 状态的原因、影响及解决方案，并通过代码示例进行说明。

什么是 Yarn Pending 状态？

在 Yarn 中，当一个应用程序的任务（Task）由于资源未满足而无法立即执行时，该任务将处于“pending”状态。这通常发生在以下几种情况下：

资源不足：当前集群的可用资源不足以满足任务的需求。
资源分配策略：集群配置的资源分配策略可能导致任务无法立即获得资源。
配置错误：不正确的集群或应用程序配置可能导致任务无法顺利调度。

Pending 状态的影响

Pending 状态可能会导致应用程序的延迟，影响整体的计算效率。在大数据处理场景中，长时间的 pending 状态可能会使整个工作流陷入停滞，从而拖慢数据处理速度。

如何解决 Yarn Pending 问题？

1. 检查资源使用情况

首先，我们需要检查当前的资源使用情况，可以通过 Yarn Web 界面或命令行工具来查看集群的资源使用状况。

这条命令将列出所有节点及其资源使用情况，包括 CPU 和内存的占用。

2. 调整应用程序的资源请求

如果应用程序的资源请求过高，我们需要根据当前集群的实际情况进行调整。例如，在提交应用程序时，可以设置资源请求如下：

确保这些资源请求可以在集群中得到满足。

3. 理解和配置队列限制

在 Yarn 中，资源通常是通过队列进行管理的。需要确认任务所在的队列是否有足够的资源。如果队列限制过低，可以通过调整 capacity-scheduler.xml 文件，来增加队列的资源配置。以下是一个简单的示例配置：

<configuration>
  <property>
    <name>yarn.scheduler.capacity.root.queue1.capacity</name>
    <value>50</value>
  </property>
  <property>
    <name>yarn.scheduler.capacity.root.queue1.maximum-capacity</name>
    <value>100</value>
  </property>
</configuration>

处理 Pending 状态的工作流程

下面是一个简单的处理 Yarn Pending 状态的工作流程示例：

flowchart TD
    A[检查资源使用情况] --> B{资源是否足够？}
    B -->|是| C[继续执行任务]
    B -->|否| D[调整资源请求]
    D --> E[检查队列配置]
    E --> F{配置是否合理？}
    F -->|是| G[等待资源分配]
    F -->|否| H[调整队列资源配置]
    H --> G