ceph报 daemons have recently crashed

问题:ceph rdma协议的集群总是报daemons have recently crashed,而且数目越来越多,然并没有找到相关错误的日志
解决:可参考官网解决方案

RECENT_CRASH

One or more Ceph daemons has crashed recently, and the crash has not yet been archived (acknowledged) by the administrator. This may indicate a software bug, a hardware problem (e.g., a failing disk), or some other problem.

New crashes can be listed with:

#ceph crash ls-new

Information about a specific crash can be examined with:

#ceph crash info <crash-id>

This warning can be silenced by “archiving” the crash (perhaps after being examined by an administrator) so that it does not generate this warning:

#ceph crash archive <crash-id>

Similarly, all new crashes can be archived with:

#ceph crash archive-all

Archived crashes will still be visible via ceph crash ls but not ceph crash ls-new.

The time period for what “recent” means is controlled by the option mgr/crash/warn_recent_interval (default: two weeks).

These warnings can be disabled entirely with:

#ceph config set mgr/crash/warn_recent_interval 0

参考:

https://docs.ceph.com/docs/master/rados/operations/health-checks/?highlight=backfillfull%20ratio
https://docs.ceph.com/docs/master/mgr/crash/?highlight=crash
  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当你看到有1个或多个守护进程(daemons)最近崩溃时,这可能是系统中存在某些问题或错误的迹象。以下是一些常见的处理步骤: 1. 查看日志:检查相关的系统日志,如/var/log/syslog、/var/log/messages等,以了解有关崩溃的更多详细信息。查找与崩溃相关的错误消息或异常堆栈跟踪,这将有助于确定问题的根本原因。 2. 重启守护进程:尝试重新启动崩溃的守护进程。这可以通过使用系统的服务管理工具(如systemctl、service等)来实现。例如,对于Ceph的守护进程,可以运行`systemctl restart ceph-osd@ID`来重新启动OSD守护进程。 3. 检查配置文件和依赖项:确保守护进程的配置文件正确,并且所需的依赖项已正确安装。在重新启动之前,检查相关配置文件(如ceph.conf)中的任何错误或不一致之处,并确保所有必要的依赖项(如库文件、软件包)都已正确安装。 4. 更新软件版本:如果你正在使用的软件版本较旧,尝试将其升级到最新版本。新版本通常会修复错误和漏洞,并提供更好的稳定性和可靠性。 5. 检查硬件问题:检查硬件是否有任何问题,如磁盘故障、内存问题或网络问题。运行硬件诊断工具(如smartctl、memtest等)来检查硬件的健康状况。 6. 寻求社区支持:如果问题仍然存在,可以向相关软件的社区或论坛寻求帮助。社区通常具有丰富的经验和资源,可以提供针对特定软件的故障排除和解决方案。 请注意,处理守护进程崩溃需要根据具体情况进行诊断和处理。上述步骤提供了一般性的指导,但实际情况可能因不同的软件和环境而有所不同。确保在执行任何更改之前备份重要数据,并小心测试任何系统配置或更新的影响。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值