集群存储,先做存储再做集群
集群三类
HA——高可用集群 HB——负载均衡集群<例如LVS> HPC——高性能集群
HA <rhel7> HA <rhel6>
corosync:集群通信引擎 openAIS(corosync取代) rgmanager:管理集群服务 dlm:集群锁机制 clvmd:集群逻辑卷
fenced:专门来负责fence通信 cman:集群管理员 modclusted:专门分发集群配置文件 ricci:集群节点远程服务
集群资源组
1.Resource Group或Service Group luci中查看显示为server group
2.VIP、服务、共享存储统称为资源
3.所有资源由脚本控制,称为resource script,这些资源脚本管理一个资源的启用、关闭和重启,统称为sysv初始化脚本
4.当一个资源失败时,集群会尝试将之重启或根据配置把整个集群服务全部重启或者默认模式,若不成功,则会尝试将资源迁移到另一个节点或者关闭它。
5.rgmanager 管理集群服务,开机应自起
资源:一般而言是VIP、服务、共享存储
order:启动顺序,设定资源相关顺序,配置集群时启动顺序很重要
location:优先在哪台机器上运行
colocation:设置几个服务在同一台机器上运行,禁止分布到不同节点
脑裂与仲裁
脑裂:有两个以及以上的节点同时向共享存储中写入数据
仲裁quorum则是为了应对这种情况 quorum=节点数/2+1 每个节点有1票,未达到quorum值则视为集群不健康,集群不能正常运行
避免脑裂
有一个配置“stonith”,一般是一个硬件设备。每个节点都受到它的控制,当发现某个节点断开(每个节点之间通过心跳线相互关联),它会强制重启或者关机该节点,将故障节点排除在选举之外,避免出现两个活跃节点从而造成脑裂。stonith统称为fence
fence设备
1.断电(power fencing)。切断电源,重启
2.存储端fence(Fabric fencing):任何活着的节点用scsi Reserve命令将存储通道锁定,防止其他节点写入
Fence Agents
系统中通过fence-agents安装一系列工具,放在/usr/sbin/fence_*
fence_apc APC电源交换 fence_uti 网络电源交换 fence_bladecenter IBM专用fence工具
fence_rsa RBM专业RSA专业fence fence_drac 戴尔的产品 fence_brocade 存储端fence工具 fence_xvm 基于虚拟机断电
fence应在物理机上配置
集群软件
pacemaker:实现了集群中CRM角色,包含集群信息库、设备引擎
RHCS:rhel6实现CRM的工具
heartbeat:既可底层通讯,也可作CRM
生产环境中pacemaker+coresync组合配置高可用集群
Conga配置集群<rhel5、rhel6> 基于web界面
有两个部分:ricci(远程节点跑的一个服务,随时监听来自luci软件的指令)
luci(在另一台机器上的管理软件,平台需要linux),管理节点不要安装在集群节点中
管理注意
1.节点部署ricci后,给用户ricci配置密码(第一次连接