大数据-之LibrA数据库系统告警处理(ALM-37013 MPPDBServer实例SOCKET异常)

告警解释

当操作系统的其它进程占用GTM实例监听端口号或双机端口号时,产生该告警。

告警属性

告警ID

告警级别

可自动清除

37013

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

对系统的影响

双机端口长时间被占用超过120s后,系统会自处理并恢复可用。但120s内,系统不可用。

系统自处理过程
  • 如果监听端口或双机端口被占用,则该GTM实例进程无法启动,集群首先会尝试重新启动该进程,该段时间系统不可用。
  • 如果在120s内该节点依然无法启动,集群会将GTM备实例升为GTM主实例,系统恢复可用。
可能原因

操作系统的其它进程占用GTM实例监听端口号或双机端口号。

处理步骤
  1. 查看告警原因。
    1. 查找产生告警的实例的GTM数据目录。
      1. 使用omm用户登录告警上报的节点。
      2. 初始化环境变量。

        source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

      3. 执行gs_om -t status --detail系统反馈类似如下信息。
         

      /opt/huawei/Bigdata/mppdb/gtm”即为实例GTM的数据目录。

  2. 假设该实例的GTM数据目录是“/opt/huawei/Bigdata/mppdb/gtm/”,使用以下命令打开gtm.conf文件:
    vi /opt/huawei/Bigdata/mppdb/gtm/gtm.conf

    找到GTM实例的监听端口参数port与双机监听端口参数local_port。

  3. 使用以下命令确认该端口是否被其它进程占用,假设该端口号是10000。
    netstat -anp | grep 10000

    如果GTM实例的监听端口或GTM实例的双机端口被占用,则查看是否是关键进程占用。

    • 是,执行6
    • 否,执行4
  4. 执行如下命令kill该进程。
    kill -9 pid
  5. 查看告警是否仍然存在。
    • 是,执行6
    • 否,处理完毕。

    收集故障信息。

  6. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  7. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  8. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

红烧小肥杨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值