容器CPU使用率过高,导致宿主机load average飙升

早上醒来已经收到多条服务器告警信息,具体是这样的,如下图:Processor load (15 min average per core)
;服务器CPU load 过高,接下来是处理过程,记录一下。

在这里插入图片描述
登录告警的服务器,这是一台openshift容器平台的计算机节点;
top查看到 load average 达到了100左右;
最高的进程占用400%

在这里插入图片描述

查看一下 这台服务器有56个逻辑c, load average达到56就算是满载了;

在这里插入图片描述
因为这是一台容器计算节点,需要找到是那个容器cpu高,继续查看
使用docker stats命令查看 k8s node节点上所有容器的CPU使用率:
如下图可见,是一个ID为8c1d2b913d93 的容器CPU使用率最高;
在这里插入图片描述

进入容器中查看CPU使用情况

docker exec -it 8c1d2b913d93 bash

继续top查看,就是这个java进程。
在这里插入图片描述
进来容器后,从主机名就可以判断是哪个项目的容器–“bigdata”
在这里插入图片描述
得到这些信息就够了,通知对应的项目组,让他们检查代码,他们选择关掉进程,CPU 使用率降下来了,load average也降下来了。这个问题算是解决了。

问题分析一波:

现象:
容器的cpu使用率达到400%,宿主机的load average 飙升到100;

疑问:
容器在创建的时候,限制使用4个CPU,现在最高使用率达到400%也是正常的,但为什么容器所在的宿主机 load average也在飙升,这样限制CPU还有什么意义吗?

分析:
load average指的是系统平均负载,具体指 在特定时间间隔内运行队列中(在CPU上运行或者等待运行多少进程)的平均进程数。
比如 load average 89 89 90 ,其中的“90”表示:
15分钟内在CPU上运行+等待运行的进程平均数.

进一步分析:
top所看到的CPU使用率是cpu正在处理当前进程任务所占用cpu比率;
load average 显示的数值是 cpu正在处理的进程数和等待处理的进程数

因为需处理的进程过多,容器被限制了cpu最多使用4个,导致等待处理进程堵塞,load average是 运行+等待运行的进程数,故load average 数值飙升。

所以,在创建容器时,需根据业务量规划好cpu资源使用。

### 回答1: 在 Linux 系统中,load average 是一个表示系统 CPU 利用率的指标。如果 load average 过高,可能会导致系统变慢或崩溃。以下是一些解决方法: 1. 找出负载的原因:使用 top 或 htop 命令查看进程列表,找出占用 CPU的进程。如果是某个进程导致负载,可以考虑优化该进程或限制其资源使用。 2. 增加系统资源:如果负载是由于系统资源不足导致的,可以考虑增加系统资源。例如,增加 CPU 核数、内存或磁盘容量。 3. 优化系统设置:可以优化一些系统设置来减少负载。例如,修改文件系统调度算法、禁用不必要的服务、调整内核参数等。 4. 分散负载:将一些任务分散到多台机器上,可以减轻单台机器的负载。可以使用负载均衡等技术来实现。 5. 升级软件:如果负载是由于软件版本过低导致的,可以考虑升级软件。新版本的软件可能会修复一些性能问题。 ### 回答2: Load average是衡量机器在某个时间段内处理能力的指标,是指过去1分钟、5分钟和15分钟内的平均进程数。当load average过高时,服务器的负载较重,可能导致服务器性能下降,甚至出现宕机等问题,因此要及时解决。一般情况下,load average在1以下时表示负载较轻,当在1-5之间时表示负载适中,而在5以上时则表示负载过重。 那么,如何解决load average过高的问题呢? 1.优化应用程序 如果服务器上运行的应用程序对CPU和内存的使用非常,很可能会导致load average过高。此时,我们可以采取优化应用的措施,比如优化代码、升级软件等。如果不能优化应用的话,可以考虑拆分应用,将各个应用分布到不同的服务器上,以减轻负载。 2.减少并发连接 服务器支持的并发连接数是有限的,当连接数过多时就会导致load average。我们可以通过限制访问速度、减少同时访问连接数等方式,来减少并发连接数。 3.增加资源 如果服务器配置较低,那么增加资源是有效的方式。比如,增加内存、CPU等硬件配置,或者调整系统内存和SWAP分区大小。 4.关闭不必要的服务 服务器上运行着不必要的服务,也会导致load average过高。因此可以考虑关闭一些不必要的服务,减少对系统资源的占用,以降低load average。 总之,如果load average过高,需要根据具体情况采取相应的措施。同时,长期关注系统负载的变化,进行监控和预警,可以避免因负载过重导致的服务器宕机等问题。 ### 回答3: Load Average通常指的是系统中正在运行的进程数量,它可以帮助您判断系统的整体负载情况。Load Average数值越,表示系统的负载越重,需要更多的资源来支持运行。 当Load Average过高时,系统可能会变得非常缓慢,甚至可能导致系统崩溃。因此,如何快速解决Load Average过高的问题就显得尤为重要。以下是几个解决方法: 1. 增加CPU和内存资源:如果您的服务器硬件配置较低,可能需要增加更多的CPU和内存资源来支持运行更多的进程。 2. 优化进程,减少无用进程:检查所有运行的进程,找出资源占用较的进程并优化它们(例如关闭不必要的应用程序或服务),瘦身服务,减少不必要请求的访问频率。 3. 分析负载:可以使用一些专业的服务器性能监控工具,如Zabbix、Nagios等软件,对系统进行负载分析,找出负载的原因,做出有针对性的调整。 4. 调整进程优先级:Linux系统中,进程可以设置不同的优先级,以确保一些重要进程的运行。可以通过命令"nice"来调整进程优先级。 总之,当Load Average过高时,及时采取以上措施可以防止系统因过多负载而崩溃,改善服务器运行的稳定性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

范一刀

你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值