随记20211228-(load average es专家)

昨天还算充实,紧接着上一天生产环境报的问题,今天继续排查,发现不是bug,是原功能就不完善,新需求

另一个问题经过排查,发现是其他团队的代码bug,我这边任务就结束了

下午又被拉到一个群,es问题,报错类似:[ElasticSearch exception [Type=es_rejected_excution_exception,reason=rejected execution of proecssing of [212121212][indices:data/write/bulk[s][p]]: BulkShareRequest [[xx_xx]]containing [135] requests, target allocation id: xxx,primary term :1 on EsThreadPoolExecutor[name = xxx/write, queue capacity = 200, xxxx.EsThreadPoolExecutor[Running, pool size = 4, cative threads = 4, queue task = 220, comleted tasks = 11111]]]]
应该是es性能不足,写入速率过低,导致任务积压,触发es拒绝策略(什么策略待研究,直接丢失吗?)

然后又学习了个load average这个指标

linux系统中的Load对当前CPU工作量的度量 (WikiPedia: the system load is a measure of the amount of work that a computer system is doing)。也有简单的说是进程队列的长度

Load Average 就是一段时间 (1 分钟、5分钟、15分钟) 内平均 Load 。

load average值的含义

  • 单核处理器
    假设我们的系统是单CPU单内核的,把它比喻成是一条单向马路,把CPU任务比作汽车。当车不多的时候,load <1;当车占满整个马路的时候 load=1;当马路都站满了,而且马路外还堆满了汽车的时候,load>1
    在这里插入图片描述
  • 多核处理器
    我们经常会发现服务器Load > 1但是运行仍然不错,那是因为服务器是多核处理器(Multi-core)。

假设我们服务器CPU是2核,那么将意味我们拥有2条马路,我们的Load = 2时,所有马路都跑满车辆。

在这里插入图片描述

转载 https://blog.csdn.net/dshf_1/article/details/104946403

然后惯例说一下自己状态感想吧,es那个问题,我拿到手毫无头绪,甚至没去想百度怎么解决,问了帮友,让我去问某个大佬,原先我是不抱有多少期待的,没想到我把问题截图一抛,没多久直接得到答复,问题原因、两种解决方案,甚至还给了他之前性能测试wiki,我那个叫一个感动啊,直接解决了我的问题,让我不得不感叹人果然很信任专家也很需要专家(心理暗暗决定也要成为他这样的专家)

可没想到同事看了我这个问题对着报错信息,流利地说出队列满了,处理速度慢了,都能看懂,我却一脸懵逼,顿时汗颜,不过我确实不如他,向他学习

虽然晚上又打游戏happy去了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值