大数据-之LibrA数据库系统告警处理(ALM-37014 Gaussdb进程锁文件已经存在)

本文介绍了当MPPDB集群中的CN或DN实例遇到锁文件创建失败告警时的症状、影响、可能原因以及详细的处理步骤,包括使用SSH检查和终止进程,以及在FusionInsightManager中下载日志进行问题排查。
摘要由CSDN通过智能技术生成
告警解释

当集群中的CN实例或者DN实例锁文件创建失败时,产生该告警。

告警属性

告警ID

告警级别

可自动清除

37014

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

对系统的影响

发生数据库锁文件创建失败时,锁文件创建失败的实例可能无法启动,集群将无法正常启动。

可能原因

系统数据实例异常终止,导致系统中存在锁文件残留。

处理步骤
  1. 使用omm用户登录告警上报的节点。
  2. 初始化环境变量。

    source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

  1. 执行如下命令获取出现告警的主机和数据实例的数据目录。(如下主机为10.252.153.218,数据目录为/srv/BigData/mppdb/data1/coordinator)
     
  2. 使用SSH方式登录上述主机,执行如下命令进入目录并检查是否存在postmaster.pid文件。
     
      
    • 是,执行5
    • 否,执行8
  3. 执行如下命令获取postmaster.pid文件中第一行的pid。
     
  4. 执行如下命令查看上述pid对应的进程是否存在。
    ps -ef |grep 42883
    omm       42883      1  4 Nov05 ?        17:25:59 /opt/huawei/Bigdata/mppdb/core/bin/gaussdb --coordinator -D /srv/BigData/mppdb/data1/coordinator
    omm      125791  55322  0 15:10 pts/0    00:00:00 grep --color=auto 42883
    • 是,执行7
    • 否,执行8
  5. 执行如下命令终止上述进程,并删除postmaster.pid文件后查看告警是否恢复。
     
      
    • 是,处理完毕。
    • 否,执行8
  6. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  7. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  8. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

红烧小肥杨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值