Dockerd 进程CPU high 100% 原因排查

文章描述了一次线上主机因dockerd进程CPU使用率过高引发的故障排查过程。问题源于docker-compose配置的日志滚动策略与定时清理任务冲突,导致日志文件损坏,进一步影响了dockerd性能。更新到dockerdv20.0.xx及以上版本可能已修复此问题。
摘要由CSDN通过智能技术生成

Dockerd 进程CPU high 100% 原因排查

现象说明

线上主机不知道操作了什么,收到了监控cpu load 告警。排查dockerd进程在作怪.

排查过程

  1. 排查容器的内存、cpu均正常.
  2. 收到故障,运维思想,先恢复生产。优雅的重启dockerd进程,不影响container运行. 具体参考:
  3. 查到dockerd进程的cpu利用率很高.
  4. 根据监控查看具体什么时候cpu涨起来的.
  5. 查看syslog 开始时间的历史操作记录
  6. 发下当时使用了docker logs 查看日志
  7. 怀疑触发docker了什么bug.(version: v18.0.32)
  8. 搜索docker logs cpu high 字眼,发现确实有类似情况。
  9. 网络资料显示,xxx-json.log 文件破坏
  10. 使用file/stat 命令查看xxx-json.log 文件,显示为data, 非text类型.
  11. 查看为什么xxx-json.log文件会被损坏?

原因/结论

最后排查是因为docker-compose文件中写了logging-driver max-size:500M 来滚动日志,但是在维护过程中,也写了定时任务去清理xxx-json.log文件(echo > ) 导致文件损坏了。

docker logs 读已损坏的日志文件,可能触发dockerd cpu high的问题。

dockerd v20.0.xx 版本后对日志驱动做过修复,可能不存在这个问题了。(未验证)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值