告警解释
GaussDB启动增备失败,产生告警。
告警属性
告警ID | 告警级别 | 告警类型 | 告警归属 | 业务类型 | 是否可自动清除 |
---|---|---|---|---|---|
5023516 | 重要 | 操作告警 | 租户面 | 云数据库 GaussDB | 是 |
告警参数
类别 | 参数名称 | 参数含义 |
---|---|---|
定位信息 | 云服务 | 产生告警的云服务 |
系统 | 产生告警的系统 | |
模块 | 产生告警的模块 | |
实例 | 产生告警的实例ID | |
附加信息 | 租户名称 | 产生告警的租户名称 |
实例名称 | 产生告警的实例名称 | |
云服务 | 产生告警的云服务 | |
服务 | 产生告警的服务 | |
微服务 | 产生告警的微服务 | |
告警源IP | 告警源IP |
对系统的影响
实例启动增备备份失败,未产生增备的时间点无法恢复。
可能原因
- Agent处理异常。
- 内核处理异常。
处理步骤
- 参考下载管理节点日志,收集相关失败日志。
- 如果管理节点日志中存在“archive on failed”关键字,则错误原因是内核处理异常或者agent处理异常。先尝试通过重新触发关键全备来再次开启(3~7),如果仍然失败在RdsBackupStartAgentLogBackupJob,则需要联系开发人员进行实例节点修复。
- 在DBS运维管理平台,选择“实例运维 > 实例管理”,在“实例列表”页签的搜索框中通过实例ID搜索实例信息。
- 单击实例名称,进入实例详情页。
- 在实例详情页下方“备份设置”处,单击“创建备份”,在弹出框选择是否是关键备份的选项中,选择“True”,单击“确定”,就下发了关键备份操作。
- 观察实例的状态,是否为“备份中”,等待备份完成。
- 如果备份流程出现失败,停留在RdsBackupStartAgentLogBackupJob处理异常,需要参考登录实例节点登录实例所在虚拟机,并且参考下载管理节点日志和收集日志,并收集告警信息,联系技术支持进行处理。
需要下载的日志信息有:
管理侧:
- DBS-GaussDB-backupmanager组件下的日志。
- DBS-GaussDB-instancemanager组件下的日志。
租户侧:
Agent组件下的:
- /home/Ruby/log/agent.log
- /home/Ruby/log/asyncJobResult.dat
GaussDB Kernel组件下的:/var/lib/log/Ruby
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html