主机环境 RedHat6.5 64位
实验环境 服务端1 ip 172.25.14.1 主机名:server1 ricci luci(为了提供Conga配置用户界面)
服务端2 ip 172.25.14.2 主机名:server2 ricci
管理端2 ip 172.25.14.2 fence_virtd
防火墙状态:关闭
一、服务介绍
参考文档:
https://blog.csdn.net/xayddxjsjxywuhui/article/details/72677547
https://www.linuxidc.com/Linux/2016-10/135979.htm
https://blog.csdn.net/mon_star/article/details/78121705
集群中luci的作用:
luci是用来配置和管理集群,监听在8084上
集群中ricci的作用:
ricci是安装在每个后端的每个节点上的,luci管理集群上的各个节点就是通过和节点上的ricci进行通信,ricci监听在11111上
集群中fence的作用:
在HA集群坏境中,备份服务器B通过心跳线来发送数据包来看服务器A是否还活着,主服务器A接收了大量的客户端访问请求,服务器A的CPU负载达到100%响应不过来了,资源已经耗尽,没有办法回复服务器B数据包(回复数据包会延迟),这时服务器B认为服务器A已经挂了,于是备份服务器B把资源夺过来,自己做主服务器,过了一段时间服务器A响应过来了,服务器A觉得自己是老大,服务器B觉得自己也是老大,他们两个就挣着抢夺资源,集群资源被多个节点占有,两个服务器同时向资源写数据,破坏了资源的安全性和一致性,这种情况的发生叫做“脑裂”。服务器A负载过重,响应不过来了,有了Fence机制,Fence会自动的把服务器A给Fence掉,阻止了“脑裂”的发生
FENCE的工作原理是:当意外原因导致主机异常或者宕机时,备机会首先调用FENCE设备,然后通过FENCE设备将异常主机重启或者从网络隔离,当FENCE操作成功执行后,返回信息给备机,备机在接到FENCE成功的信息后,开始接管主机的服务和资源。这样通过FENCE设备,将异常节点占据的资源进行了释放,保证了资源和服务始终运行在一个节点上。
Fence分类:
硬件Fence:电源Fence,通过关掉电源来踢掉坏的服务器
软件Fence:Fence卡(智能卡),通过线缆、软件来踢掉坏的服务器
第二种分法:
内部FENCE:IBM RSAII卡,HP的iLO卡,还有IPMI的设备等
外部FENCE:UPS、SAN SWITCH、NETWORK SWITCH等
实际坏境中,Fence卡连接的都是专线,使用专用的Fence网卡,不会占用数据传输线路,这样,更能保证稳定及可靠性。
Fence卡的IP网络和集群网络是相互依存的
详细配置可以查看:红帽企业版Linux6集群管理
二、服务的安装配置
1.安装ricci
server1和server2每个节点都要做:
# yum install -y ricci
设置ricci用户的密码
# passwd ricci
启动并且开机自启
# /etc/init.d/ricci start
# chkconfig ricci on
2.安装luci
只在一台主机上做,我是在172.25.14.1上做