Service Guard
Serviceguard是HP-UX的cluster service 集群服务软件,通过Serviceguard可以搭建高可用集群,拥有了软硬件的高度冗余,避免了节点级的单点故障。
名词解释:
活动节点:在 Serviceguard 群集中运行的任何主机系统都称为活动节点
主节点:指定要启动故障切换程序包的节点叫主节点
代管节点:还需要指定一个或多个其他节点,这些节点称为代管节点
Serviceguard 守护程序
Serviceguard 使用下列守护程序:
/usr/lbin/cmclconfd - Serviceguard 配置守护程序
/usr/lbin/cmcld - Serviceguard 群集守护程序
/usr/lbin/cmfileassistd - Serviceguard 文件管理守护程序
/usr/lbin/cmlogd - Serviceguard Syslog 日志守护程序
/usr/lbin/cmlvmd - 群集逻辑卷管理器守护程序
/opt/cmom/lbin/cmomd - 群集对象管理器守护程序
/usr/lbin/cmsnmpd - 群集 SNMP 子代理(可以选择运行)
/usr/lbin/cmserviced - Serviceguard 服务助手守护程序
/usr/lbin/qs - Serviceguard Quorum Server 守护程序
/usr/lbin/cmnetd - Serviceguard Network Manager 守护程序
/usr/lbin/cmvxd - Serviceguard - Veritas 成员协调守护程序(仅当安装了 Veritas CFS
时才会存在)
/usr/lbin/cmvxpingd - Serviceguard - Veritas 激活守护程序(仅当安装了 Veritas CFS
时才会存在)
/usr/lbin/cmdisklockd - 锁定 LUN 守护程序
/usr/lbin/cmlockd - 实用守护程序
/opt/sgproviders/bin/cmwbemd - WBEM 守护程序
/usr/lbin/cmproxyd - 代理守护程序
上述各个守护程序均将日志记录到 /var/adm/syslog/syslog.log 文件中,但 /opt/cmom/
lbin/cmomd 守护程序除外,它将日志记录到 /var/opt/cmom/cmomd.log 中。Quorum
Server 在群集外部运行。缺省情况下,它将日志记录到标准输出中,建议您将该输出重定向到名
为 /var/adm/qs/qs.log 的文件中。
群集管理器如何工作
群集管理器用于初始化群集、监视群集的运行状况、识别出现的节点故障以及当有节点加入或脱离群集时管理群集的重组。群集管理器作为守护程序运行在每个节点上。在群集启动和重组期间,会选出一个节点作为群集协调器。尽管所有节点都执行某些群集管理功能,但群集协调器是节点内通信的中枢点。
心跳线消息
群集管理器操作的核心是在群集中的各个节点之间发送和接收心跳线消息。如果某个群集节点未在规定时间内从其他节点收到心跳线消息,则将启动群集重组
程序包的运行方式
Serviceguard 使用程序包启动和暂停已配置的应用程序。故障切换程序包也是 Serviceguard 中的故障切换行为单元。程序包是服务、磁盘卷和 IP 地址的集合,该集合由 Serviceguard 进行管理,以确保其中资源的可用性。每个群集最多可有 300 个程序包,服务总数可达 900 个。
检查群集和程序包状态
cmviewcl :简介显示集群、节点、程序包的运行状态
cmviewcl –v:详细简介显示集群、节点、程序包的运行状态
我们是由2台HP-UX小机组成的双节点集群模式
node1:TJGRDB 用途:搭载oracle数据库
node2:TJGRAPP 用途:搭载perl汇总应用
冗余模式见图片
分组网双节点service guard配置信息
TJGRAPP[#/var/adm/syslog]cmviewcl -v
CLUSTER STATUS
cluster_oracle up
NODE STATUS STATE
TJGRDB up running
Cluster_Lock_LVM:
VOLUME_GROUP PHYSICAL_VOLUME STATUS
/dev/vglock /dev/disk/disk37 up
Network_Parameters:
INTERFACE STATUS PATH NAME
PRIMARY up 1/0/10/1/0 lan16
PRIMARY up LinkAgg0 lan900
PACKAGE STATUS STATE AUTO_RUN NODE
pkg_ora up running enabled TJGRDB
Policy_Parameters:
POLICY_NAME CONFIGURED_VALUE
Failover configured_node
Failback manual
Script_Parameters:
ITEM STATUS MAX_RESTARTS RESTARTS NAME
Subnet up 10.166.173.0
Node_Switching_Parameters:
NODE_TYPE STATUS SWITCHING NAME
Primary up enabled TJGRDB (current)
Alternate up enabled TJGRAPP
Other_Attributes:
ATTRIBUTE_NAME ATTRIBUTE_VALUE
Style legacy
Priority no_priority
NODE STATUS STATE
TJGRAPP up running
Cluster_Lock_LVM:
VOLUME_GROUP PHYSICAL_VOLUME STATUS
/dev/vglock /dev/disk/disk37 up
Network_Parameters:
INTERFACE STATUS PATH NAME
PRIMARY up 1/0/10/1/0 lan16
PRIMARY up LinkAgg0 lan900
启动数据库脚本 pkg_ora_start.sh
export ORACLE_SID=mdsoss 设置环境变量SID
# Start the database listener
echo "Startting the database listener..." 启动数据库监听器
lsnrctl start
# Star the database
sqlplus -S "/ as sysdba" <静默方式进入sqlplus工具(没有提示符、回复信息)
connect / as sysdba 切换sys用户
startup 启动数据库到open状态
exit 退出sqlplus工具
EOF
停止数据库脚本 pkg_ora_stop.sh
# Stop the database listener
echo "Stopping the database listener..."
lsnrctl stop 停止监听
# Stop the database
sqlplus -S "/ as sysdba" <静默方式进入sqlplus工具(没有提示符、回复信息)connect / as sysdba 切换sys用户
shutdown immediate 立即停止数据库
exit 退出sqlplus工具
EOF
我写了一些配置node 、 pkg_ora 命令,介绍了功能特点
1. netstat -in +n已数字方式显示IP地址 -n已主机名方式显示IP地址
2. netstat -rn 查看小机路由 +n选项,已数字方式显示路由信息,-n已主机名方式显示路由信息
3. cmviewcl 查看双机状态 -v 显示详细信息
4. cmhaltpkg pkg_ora (程序包) 停止这个程序包,这个程序包含有 例如“停止和启动数据库脚本” “停止和启动应用服务脚本”状态:
5. cmhaltnode -f 【TJGRDB】 在HA主备模式中默认剔除当前“TJGRDB”结点,可以指定结点【TJGRDB】【TJGRAPP】,这是最正常的流程了。
6. shutdown -hy 0 关闭小机命令
7. cmviewcl 查看双机状态 结点状态 (TJGRDB结点应该已经被剔除了) pkg包状态(程序包应该已经停止了)
8. cmrunnode 【TJGRDB】 在HA主备模式中默认添加当前“TJGRDB”结点,可以指定结点【TJGRDB】【TJGRAPP】
9. cmrunpkg pkg_ora (程序包) 启动这个程序包,这个程序包含有 例如“停止和启动数据库脚本” “停止和启动应用服务脚本”状态:runing
10.cmmodpkg -e pkg_ora 设置AUTO_RUN Enabled 开机自动启动
11.cmmodpkg -d pkg_ora 设置AUTO_RUN Disabled 开机自动禁止
12.machinfo HP-UX主机硬件信息
13.getconf MACHINE_SERIAL 主机序列号TJGRDB:SGHxxxxx TJGRAPP:SGHxxxxx
4cf23b406af3a0578ab0138d87a3c141.gif
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26686207/viewspace-721114/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/26686207/viewspace-721114/