云数据库 GaussDB启动实例(节点)失败解决方法

告警解释

启动数据库实例或者节点失败,产生告警。

告警属性

告警ID

告警级别

告警类型

告警归属

业务类型

是否可自动清除

5023095

重要

操作告警

租户面

云数据库 GaussDB

告警参数

类别

参数名称

参数含义

定位信息

云服务

产生告警的云服务

系统

产生告警的系统

模块

产生告警的模块

实例ID

产生告警的实例ID

实例名称

产生告警的实例名称

实例数据IP

产生告警的实例的数据浮动IP列表。在没有数据浮动IP时不展示此字段。

工作ID

产生告警的工作流ID

附加信息

租户名称

产生告警的租户名称

实例名称

产生告警的实例名称

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

对系统的影响

用户下发启动的数据库或者下发启动的实例节点未启动,用户无法连接数据库实例或者节点。

可能原因
  • 开启实例的HA监控失败。
  • 网络错误。
处理步骤
  1. 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,进入ManageOne运维面。

    • 密码方式:输入账号和密码。
      • 默认账号:bss_admin

        对于从8.2.0或更早版本升级上来的ManageOne,默认账号为admin。

      • 默认密码:参见《华为云Stack 8.3.1 账户一览表》的“A类(Portal)”页签中,“ManageOne运维面”账户对应的默认密码。
    • USB Key方式:插入已预置用户证书的USB Key,选择设备和用户证书,并输入PIN码。

  2. 在“告警 > 告警管理 > 当前告警”中查看告警信息,获取告警中的实例ID或者工作ID。
  3. 登录DBS运维管理平台,选择“实例运维 > 任务管理”,右上角筛选条件选择“实例ID”或“任务流ID”,输入框中输入上一步获取的实例ID或工作ID,执行搜索。

    “失败原因”列输出了失败时的程序错误日志。单击“树表”,则可以查看任务失败具体的环节。

  4. 根据3中任务执行结果,定位不同的故障场景操作。

    • 如果是OpenHa4InstanceTask开启实例HA任务失败,则可能是HA服务异常,请确保HA服务正常后参考重做Task从OpenHa4InstanceTask重做即可。
    • 如果是OpenHa4NodeTaskV2开启节点HA任务失败,则可能是HA服务异常,请确保HA服务正常后参考重做Task从OpenHa4NodeTaskV2重做即可。
    • 如果是RestartNodeTask或RestartNode4ResizeTask任务失败,则可能是服务到实例间网络异常,请继续执行以下步骤。

  5. 检查GaussDB Service是否可通过SSH连接到实例

    1. 参考查看管理节点IP信息查询GaussDB实例管理节点IP。
    2. 登录DBS运维管理平台,选择“实例运维 > 实例管理 > 实例列表”, 输入实例ID,执行搜索。
    3. 单击5.b中查询的实例名称,进入实例详情,在实例详情中查找“管理虚拟ip”,即GaussDB实例的管理VIP。
    4. 参考登录数据库管理节点,以opsadmin用户名登录5.a查询到的管理节点,执行ping命令,确认5.c中GaussDB实例的管理VIP的网络是否正常。
      • 如果无法ping通,说明GaussDB Service到实例网络不通,请联系网络管理员首先排查网络故障,网络故障排除后重试重启操作。
      • 如果可ping通,说明GaussDB Service到实例网络可以联通。在树表里面RestartNodeJob任务,单击“操作”下拉箭头中的“重做”进行任务重试。如果启动操作仍然失败,请执行6

  6. 参考下载管理节点日志收集日志,并收集告警信息,联系技术支持进行处理。

    需要下载的日志信息有:

    管理侧:

    • DBS-GaussDB-backupmanager组件下的日志。
    • DBS-GaussDB-instancemanager组件下的日志。

    租户侧:

    Agent组件下的:

    • /home/Ruby/log/agent.log
    • /home/Ruby/log/asyncJobResult.dat

    GaussDB Kernel组件下的:/var/lib/log/Ruby

告警清除

此告警修复后,需要检查实例或者节点的HA是否打开,如果未打开,需要手动打开实例HA。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值