GBase 8a 问题处理-集群管理节点无法正常启动

问题版本:GBase 8a V8.6.2-43 R20

问题简述:在进行迁移工作的数据导入之后,启动集群所有管理节点一直不能正常启动,通过命令service gcware stop 也不能停止。

报错信息:

【gcadmin 报错】

Could not initialize CRM instance error: [6]->IGC AIS ERR TRY AGAIN]

【管理节点状态】

corosync is stopped

gclusterd is stopped

recover (pid 127432) is running..

【停止管理节点报错】/opt/gcluster/log/gcluster/system.log

Stopping GCMonit fail! Info: [gcmonit] share memory get error

Signaling GCRECOVER (gcrecover) to terminate: [ OK]

Waiting for gcrecover services to unload:

解决方案:

(1)使用root用户将/var/lib/gcware中CLUSTERSTATE以及CLUSTERSTATE.bak文件复制到其他地方。

(2)将管理节点的corosync、gbased、gclusterd、gcmmonit、gc_sync_server进程杀掉

killall -9 corosync gbased gclusterd gcmmonit gc_sync_server

若killall没有安装还可采用如下命令:

ps -ef|grep -E 'gc|coro|gbased' |grep -v grep|awk '{print $2}'|xargs kill -9

(3)检查是否所有集群服务状态为【stop】service gcware status

(4)删除/var/lib/gcware中CLUSTERSTATE以及CLUSTERSTATE.bak文件

(5)gcwexec启动集群服务

问题分析:

之前现场出现过由于异常断电或者文件系统损坏导致某一个coor节点上gcware的持久化文件损坏,引起corosync服务无法启动,这种情况可以通过从其他好的节点,拷贝一个gcware目录来解决,或者删除CLUSTERSTATE以及CLUSTERSTATE.bak文件。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值