RHCS 6.5 由于resource-agents-3.9.2-40.el6版本过低导致rgmanager[61164]: [fs] umount failed - REBOOTING问题的解决...

最新推荐文章于 2024-11-08 12:34:34 发布

weixin_34112181

最新推荐文章于 2024-11-08 12:34:34 发布

阅读量204

点赞数

文章标签： php

原文链接：http://www.cnblogs.com/guilingyang/p/6116652.html

版权

問題描述：

RHEL 6.5版本RHCS在disable或者relocate service的時候，會導致節點重啟，查看日誌顯示umount掛载點失敗，日誌如下：

Nov 29 16:03:50 phblwdb1 rgmanager[61098]: [fs] Sending SIGKILL to processes on /PHBLW_D01
Nov 29 16:03:50 phblwdb1 rgmanager[61141]: [fs] 'umount /PHBLW_D01' failed, error=1
Nov 29 16:03:51 phblwdb1 rgmanager[61164]: [fs] umount failed – REBOOTING

①為什麼會umount失敗

②為什麼會導致節點REBOOTING

第一个umount失败的问题，我的情況是如果在一个节点cd 到挂载的目录(如这里的/PHBLW_D01)，在另一个节点或本节点disable或relocate跟这个目录相关的服务，就会由于umount失败导致reboot。

用一个流程图描述这个过程如下：

正常情况下，disable的时候一般都有跟挂载点相关的进程，使用force_unmount参数，就会kill掉所有的进程，然后umount挂载点。

这里因为我使用着这个挂载点(cd 在挂载点)就kill不掉进程，是由于resource-agents-3.9.2-40.el6这个包版本过低引起，算是el6.5的bug,我们需要使用更高版本的包，

Update to resource-agents-3.9.2-40.el6_5.5 or later, or to resource-agents-3.9.5-12.el6 or later

我们可以去RHEL 6.6及以上的ISO文件找到，这里也提供一个下载链接：

http://rpm.pbone.net/index.php3?stat=3&search=resource-agents&srodzaj=3&dist[]=77

注意应用包的时候是不能直接rpm -e旧包的，因为跟rgmanager等相关的HA包关联，必须使用rpm -U直接升级。

第二个问题就好解释了，unmount失败之后因为参数self_fence="1"的存在导致reboot.

参考文档：

1. Red_Hat_Enterprise_Linux-6-Cluster_Administration-en-US

解释了force_umount和self_fence参数的作用

2.https://access.redhat.com/solutions/1462783

[fs or clusterfs resource fails to stop when a process has its current working directory (cwd) within the resource's mountpoint in a RHEL 6 High Availability cluster]

转载于:https://www.cnblogs.com/guilingyang/p/6116652.html

weixin_34112181

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。