JMS集群故障

集成平台遭遇JMS故障,因134主机问题导致文件锁定,影响集群服务。经过多次重启与资源迁移,最终成功恢复服务。故障原因为宿主机与存储通信异常。解决方案包括优化JMS消息处理、减少消息存储时间、改善存储性能和加强监控,防止类似故障发生。
摘要由CSDN通过智能技术生成

集成平台JMS故障

故障描述

集成平台业务通信中断 业务不可用

故障处理过程

  1. 发现134机器无法登陆,监控脚本报错,weblogic控制台页面显示该主机状态为SHUTDOWN,

  2. 私有云团队对134机器排查时发现,虚拟化控制台显示该主机黑屏且无法操作,通过授权后对这台机器进行重启,准备恢复这台主机;

  3. 将JMS集群中其余三台主机135/136/137重启JMS服务,但重启失败,显示重启需要加载的文件被锁定,无法打开文件,经过排查发现被锁定的文件,之前均被134这台主机使用,被JMS应用加文件锁;

  4. 私有云团队反馈无法重启134这台主机,报错内容为“由于保护JCPT_core_8.32_BCLinux7.3_45.vmdk的锁定已丢失可能是基础存储出现问题”确定是宿主机有问题,准备重启宿主机。

  5. 私有云团队反馈重启宿主机有报错,该宿主机共有6台虚拟机,为了不影响其他5台虚拟机业务,正在迁移5台虚拟机到其他宿主机上,保留jms单台虚拟机,迁移完成后对该问题宿主机进行重启;

  6. 私有云团队反馈已经将134主机关闭;

  7. 第二次在135/136/137重启服务,日志依然报错,集群启动所依赖的文件还是处于被锁定的状态,判断私有云控制台虽显示关闭的该主机,实际并未真正关闭,访问文件的链路未释放,现在需要尽快停掉

  8. 等待134宿主机关机,先进行重启,如果重启成功则系统恢复正常,如果重启不成功则说明文件损

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机猿巧合.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值