RHCS集群配置安装源(两个节点均需要配置)
vi /etc/yum.repos.d/local.repo
[redhatxx]
name=redhatxx
baseurl=http://xx
gpgcheck=0
enabled=1
gpgkey=file:///xx
[HighAvailability]
name=HighAvailability
baseurl=http://xx
gppcheck=0
enabled=1
gpgkey=file:///xx
(没这个会报错:Public key for xxx.rpm is not installed)
[ResilientStorage]
name=ResilientStorage
baseurl=http://xx
enabled=1
gpgcheck=0
gpgkey=file:///xx
yum clean all && yum makecache
安装集群服务
yum install -y ricci rgmanager cman
配置ricci账号密码
passwd ricci (密码:Passw0rd)
启动集群服务
service ricci start; chkconfig ricci on
service rgmanager start;chkconfig rgmanager on
chkconfig cman on
集群配置ui(luci在节点2),具体操作
安装luci: yum install –y luci (图形管理界面,图形服务端口为8084)
service luci start; chkconfig luci on
打开浏览器访问: https://xx:8084,账号密码为系统账号root及密码
点击创建,2台虚机会自动重启,然后创建成功
点击创建,2台虚机会自动重启,然后创建成功
查看心跳盘的UUID,注意要用小写
fence_vmware_soap -z -l 账号 -p 密码 -a vcenterIP -o list | grep 节点1
fence_vmware_soap -z -l 账号 -p 密码 -a vcenterIP -o list | grep 节点2
add fence method
两个节点都要加,配置fence到此结束
配置失败转移策略
测试集群时,遇到reboot切换资源没问题,但是断网卡或者关电源集群切换失败的问题。用clustat命令发现集群服务down了,查看服务发现cman服务停止,看日志发现如下报错:
用命令dlm_tool leave rgmanager解决此问题。
DLM动态锁管理机制
还有一个经验是,如果集群出现问题,首先要看ricci,rgmanager,cman服务是否是开机自启动,gfs2和clvmd服务是否关闭了。