HACMP&Cluster相关及常用命令

HACMP的常用命令:

1启动HACMP

使用smitty clstart命令用来启动HACMP

# smitty clstart

- 运行指令"smit clstart"回车. 等待命令执行OK,退出smit.

- 等待HACMP完全启动,可用指令"tail -f /tmp/hacmp.out"观察HACMP启动状况.

- 用指令"netstat -i"检查IP address,确认主网卡使用service IP adress,

备用网卡使用standby IP address.

- 用指令"lsvg -o"检查vary on VG,确认共享VG变为varyon状态.

- 用指令"df"检查mount的文件系统.

- 确认属于Node1online应用正常.

注:有两种启动HACMP的方式:

now手工启动HACMP

restartboth在系统启动时自动启动HACMP

2停止HACMP

使用smitty clstop该命令用来停止HACMP

- 运行指令"smit clstop"回车.shutdown mode项选择graceful并回车, 等待命令执行OK,退出smit.

- 等待HACMP完全停止,可用指令"tail -f /tmp/hacmp.out"观察HACMP停止状况.

- 用指令"netstat -i"检查IP address,确认主网卡变为boot IP adress,备用网卡使用standby IP address.

- 用指令"lsvg -o"检查vary on VG,确认共享VG变为varyoff状态.

注:有三种停止方式:

graceful: 只停止本节点上HACMP的运行,并释放由本节点管理的资源,但允许其它节点接管。(是指在关闭双机软件时将调用客户应用预定义的善后处理例程。)

graceful with takeover停止本节点上HACMP的运行,释放资源,让其他节点接管。(是指该节点将关闭双机软件并释放资源请求备节点进行接管。)

forced停止本节点上HACMP的运行,但不释放资源。(是指立即关闭双机软件不调用任何客户应用的善后处理例程。)

3查看cluster运行情况和HACMP状态

使用/usr/es/sbin/cluster/clstat命令用来显示HACMP状态。

查看cluster运行情况:/usr/sbin/cluster/clstat

# /usr/sbin/cluster/clinfo –a

/usr/sbin/cluster/clstat可以帮助你查看当前HACMP的节点状态。

屏幕会如下显示:

clstat - HACMP for AIX Cluster Status Monitor

----------------------------------------------------------------

Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999

State: UP Nodes: 2

SubState: STABLE

Node: j50a State: UP 节点A状态

Interface: j50_a_srv (0) Address: 192.9.200.1 服务IP地址

State: UP 服务IP状态

Interface: j50_a_tty1 (1) Address: 0.0.0.0

State: UP 心跳线状态

Node: j50b State: UP 节点B状态

Interface: j50_b_srv (0) Address: 192.9.200.2 服务IP地址

State: UP 服务IP状态

Interface: j50_b_tty1 (1) Address: 0.0.0.0

State: UP 心跳线状态

************************ f/forward, b/back, r/refresh, q/quit *****************

节点和CLUSTER绿色为正常,红色表示HACMP宕机或没有起来,黄色表示HACMP处在不稳定状态,可能是某节点HACMP正在启动、切换、停止。

4查看HACMP的输出

#tail -f /tmp/hacmp.out

HACMP启动时,用该命令查看该文件中有无报错显示

5查看地址信息

#netstat -i

用该命令查看网卡绑定的地址类型是否正确,三种类型:boot1boot2service

6查看逻辑卷组和文件系统

#lsvg -o

用该命令查看应该激活(varyon)VG是否激活。

#mount

用该命令查看应该mount上的文件系统是否正常。

7、查看HACMP配置情况

# /usr/es/sbin/cluster/utilities/cllscf 显示群集拓朴

# /usr/es/sbin/cluster/utilities/cllsclstr 显示群集定义

# /usr/es/sbin/cluster/utilities/cllsnode 按节点显示拓朴信息

# /usr/es/sbin/cluster/utilities/cllsnw 按网络名称显示拓朴信息

# /usr/es/sbin/cluster/utilities/cllsif 按网卡显示拓朴信息

# /usr/es/sbin/cluster/utilities/clshowres 显示资源组信息

8、查看Cluster的进程状态:

# ps -ef | grep cluster

注:应有三个HACMP进程:clstrmgrclinfoclsnuxpd

9、查看Cluster的日志及错误信息(HACMP环境下的排错):

HACMPLOG文件:以下文件都是文本文件,可以用VI来看.每个日志文件都含有每个信息的产生时间.

/usr/adm/cluster.log   :记录了HACMP的状态,HA的守护进程所产生.

/tmp/hacmp.out         :记录了HA的详细脚本.

/usr/sbin/cluster/history/cluster.mmdd :记录了HA的各个事件的发生.

/tmp/cm.log            :clstrmgr进程产生,每次HA重起时会被覆盖.

注:可以在启动HACMP时使用 # tail f /tmp/hacmp.out命令,以查看HACMP的启动是否正常或跟踪启动时的错误信息。

10、查看Cluster运行的历史记录:

# cd /usr/sbin/cluster/history

注:此目录下存放着每天的Cluster运行记录

11、查看Cluster运行时的网络情况及资源组的使用情况:

HACMP启动之前:

# netstat -i

此时应可以看到bootstandby地址

# lsvg -o

此时只能看到本地的VG

HACMP启动之后:

# netstat -i

此时应可以看到servicestandby地址

# lsvg -o

此时应可以看到本地的VG及共享VG

12、存储和恢复Cluster的配置:

存储cluster的配置:

#smitty hacmp

选择:Cluster ConfigurationCluster SnapshotsAdd a Cluster Snapshot

键入Snapshot文件名(Cluster Snapshot Name

恢复cluster的配置:

# smitty hacmp

选择:Cluster ConfigurationCluster SnapshotsApply a Cluster Snapshot

键入Snapshot文件名(Cluster Snapshot Name

注:菜单中各项的意义:

Cluster Snapshot Name指定Cluster Snapshot的文件名

Cluster Snapshot Des criptionCluster Snapshot地描述

Un/Configure Cluster Resource是否重新配置Cluster资源

Force Apply if verify failsCluster校验失败时,是否强制恢复配置

13、注意:向由HACMP管理的共享VG中增加FS时的具体步骤为:

1)、# smitty

选择:System storage management

File systems

Add/change/show/delete file systems

Journaled file systems

Add a journaled file system

Add a standard journaled file system

选择共享VG

指定FS的大小,Mount point

2)、# smitty clstop

停止HACMP的运行

3)、在增加FS的节点上作:

# varyoffvg SHARE_VG_NAME

# exportvg SHARE_VG_NAME

在另一个节点上作:

# importvg –y SHARE_VG_NAME –f hdiskX

# varyonvg SHARE_VG_NAME

作此步的目的是将新加入的FS的定义取过来

4)、# smitty hacmp

选择:cluster configuration

cluster resources

define resource group

change/show resources for a resource group

将增加的FS加入到Cluster资源组的定义中

5)、# smitty hacmp

选择:cluster configuration

cluster resources

synchronize cluster resources

同步Cluster的资源组的配置

6)、# smitty hacmp

选择:cluster configuration

cluster verification

进行Cluster配置的校验

14Cluster的配置参数:

参数名称参数值

Cluster ID

Cluster Name

Node Name

Resource Group Name

Node RelationshipCascadingcascading

Participating Node Names

Service IP label

Filesystems

Filesystems Consistency Checkfsckfsck

Filesystems Recovery MethodSequentialsequential

Volume Groups

Application Servers

Start s cript

Stop s cript

检查心跳线是否已经配置好:

1、在两台上分别输入如下命令:

S85_1# cat /etc/hosts >/dev/tty0

S85_2# cat

如果在S85_2机能接收到信息,则表明心跳线已经配置好

2、测试心跳线是否可以正常工作:

A机上:

# stty

B机上:

# stty

如果在两台主机上均出现了该TTY的配置信息,则说明心跳线设置正确。

安装HACMP时,一般不选择全部安装,只安装一部分关键的软件,如cluster.adtcluster.basecluster.cspoccluster.doc.en_US

15HA可把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来.

1/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology

2/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions

3/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node

4/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name

5/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter

6/usr/es/sbin/cluster/utilities/clshowres -g'sxptt_con_rg'

Show Resource Information by Resource Group

7/usr/es/sbin/cluster/utilities/clshowres -n's85a'

Show Resource Information by Node

Filesystems Consistency Check

1. fsck

2. logredo

Resource Group的三种节点关系

(Node Relationship):

(1) Cascading

(2) Concurrent

(3) Rotating

HA启动脚本:/usr/sbin/cluster/local/app_start1

HA停止脚本:/usr/sbin/cluster/local/app_stop1

lspv -p hdiskx 列出hdiskxPP的状态

lspv hdiskx hdiskx上的详细信息

lspv 看硬盘及所在VG

lslv lv00 查看LV状态

lsvg -p datavg 看指定VG上所有的硬盘

16、人为接管HACMP

在某些维护情况下,需将某节点的HACMP及应用切换至另一节点.

- 运行指令"smit clstop"回车.shutdown mode项选择takeover并回车, 等待命令执行OK,退出smit.

- 等待HACMP完全停止,可用指令"tail -f /tmp/hacmp.out"观察HACMP停止状况.

- 用指令"netstat -i"检查IP address,确认主网卡变为boot IP adress, 备用网卡使用standby IP address.

- 用指令"lsvg -o"检查vary on VG,确认共享VG变为varyoff状态.

- 在另一节点运行相同命令,确认网卡,VG及应用接管成功。
17、如何删除系统发给root用的mail ?

# change to system mail directory

cd /var/spool/mail

# backup root mail to OtherUser ( can use pop3 recevied mail user)

# if you have configure /etc/aliases file, you can ignore the step

cat root >> [OtherUserID]

# clean root mail file

true > root

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/14184018/viewspace-750443/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/14184018/viewspace-750443/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
AIX常用命令://查看机器序列号,IBM的基本信息都可以通过该命令查询得到 #prtconf #oslevel -r == uname -a //操作系统版本 #oslevel //查看操作系统版本ex :5.1.0.0 #oslevel -r //ex:5100-04 == oslevel -q //双机软件版本号 # lslpp -l|grep cluster //显示graphic display # lsdisp //查看CPU的个数 # bindprocessor -q //查看CPU的主频,操作系统版本最低是AIX 5.1,包含在软件包bos.pmapi.pmsvcs pmcycles This machine runs at 1500MHz //显示cpu的主频是1.5G #如何查找根文件系统(/)中的大文件 find -xdev -size +xxxx -ls #查找根卷组下大于2M的文件, 并根据文件大小排序, 大文件在前. find / -xdev -size +1024 -ls |sort -r +6 8277 624 -r-xr-xr-x 1 root system 635390 Jul 31 2003 /sbin/helpers/jfs2/fsck 28 596 -rw-r--r-- 1 root system 609388 Apr 12 17:25 /smit.log 30 1660 -rw-r--r-- 1 root system 3338083 Apr 5 14:08 /core #查看备份磁带中备份文件的大小 tcopy /dev/rmt0 tcopy: Tape File: 1; Records: 1 to 251; Size: 2097152. ---磁带机文件头大小 tcopy: Tape File: 1; Record: 252; Size 344064. ---磁带机文件头大小 tcopy: File: 1; End of File after: 252 Records, 526729216 Bytes. ---文件大小 tcopy: The end of the tape is reached. tcopy: The total tape length is 526729216 bytes. #如何取定文件与文件集的对应关系,有时想使用某个安装文件, 但没有安装包含该文件的文件集,找到文件集来安装所需文件 首先确认系统中已经安装了“bos.content_list”文件集(fileset), 如果没有安装, 请使用smitty installp进行安装. 运行which_fileset命令, 根据文件查找对应的文件集. 例如: #which_fileset iostat /usr/bin/iostat bos.acct 5.1.0.0 运行lslpp -f 命令, 查看指定文件集中包含的文件: #lslpp -f bos.acct //出于AIX系统安全考虑, 需要使某些用户只能在控制台登录使用,而不允许远程登陆使用. 更改/etc/security/user 文件中需要限制的用户的rlogin属性(rlogin = false) 当再次尝试远程登录时, 系统报错:Remote logins are not allowed for this account, 表示修改成功 //如何自动logout用户 有的用户登录后就长时间空闲,有可能导致安全上的问题,通过打开 /etc/profile 中 TMOUT 注释,将在设置的时间到达后自动logout用户 例如: export TMOUT=120 那么, 用户两分钟没有击键,将自动logout //AIX系统中如何限制用户所使用文件的大小(AIX小型机有大文件限制) >#smit chuser 在菜单上选择要控制的用户, 并修改下面两项: Soft FILE size [aaa] Hard FILE size [aaa] 则修改后用户的文件大小最大为aaa×512 bytes. >如何验证? 可以用该用户登录系统, 使用命令“ulimit -f”和“ulimit -Hf”可分别显示其fsize,fsize_hard的大
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值