【HP-Unix盘符飘移分析】HP-Unix系统+SAN存储+Oracle数据场景

1 简介
HP-UX 全称为Hewlett Packard UniX,是惠普科技公司(HP,Hewlett-Packard)研发的类UNIX 操作系统,它基于System V,是Unix 的一个变种。HP-UX 支持HP 的PA-RISC 处理器以及Intel 的Itanium 处理器。

1.1 多路径
HP-UX系统有两种多路径软件,分别为PV-Links和Native_Multi-Path(NMP)。华为UltraPath多路径目前不支持HP-UX系统。
• PV-Links
PV-Links是通过将同一个LUN的多条路径加入同一个VG中,通过VG的功能来实现多路径的管理。PV-Links多路径默认不会激活,需要进行手动设置。PV-Links不支持ALUA。
• NMP
不需要进行相关的设置即可使用,支持ALUA。主要支持以下几种负载均衡策略:
Round_robin(默认):该策略在多条路径中同时下发I/O,使用于多条路径I/O处理能力相同的阵列。
Least command load:该策略选择挂起I/O最少的路径下发下一个I/O,该策略适合于多条路径I/O处理能力不同的阵列。
Cell aware round robin:该策略适合于支持硬分区的主机,减少内存延迟。
Closest path:该策略适合于cell_based平台,主要是根据当前运行的CPU所在的cell来选择路径。
Prefer Path:该策略用户可自行设定优选路径。
Weighted round robin:该策略可设定每条路径下发I/O的百分比。

1.2 卷管理软件
HP-UX上支持两种卷管理工具:LVM和VxVM。其中LVM是HP-UX系统默认的卷管理工具,系统默认已经安装。
LVM可以将几个磁盘(物理卷)里的空间组合成一个卷组,然后把卷组中的空间再分为逻辑卷(LVM里的分区)。
在使用LVM之前,需要先掌握LVM中的几个概念,下面分别加以介绍。

• 物理卷
被LVM管理的磁盘被称为物理卷(PV,Physical Volume)。磁盘被LVM使用之前,必须将一些特殊的数据结构创建在磁盘上。一旦这些数据被创建,磁盘就被认为是物理卷了,可以加入卷组中。

• 物理卷设备文件
可以通过与物理卷相关的磁盘设备文件引用物理卷。由于磁盘可能被关联为块设备和字符设备模式,故每个物理卷具有块和字符设备文件。例如:
• /dev/dsk/c0t3d0 #在SCSI地址3的块设备文件。
• /dev/rdsk/c0t3d0 #在SCSI地址3的字符设备文件名。

• 卷组
卷组(VG,Volume Group)由一个或多个物理卷组成。卷组中的物理卷组成一块能分配给一个或多个逻辑卷的磁盘空间。

• 卷组设备文件
卷组也是通过设备文件相关联的。每个卷组在/dev下包含一个子目录,包含一个叫做group的设备文件与卷组本身相关联,以及一些与卷组中的所有逻辑卷相关联的设备文件。卷组子目录的名字确定了卷组的名字,例如:
• /dev/vg01 #包含了与vg01有关的设备文件的目录。
• /dev/vg01/group #vg01卷组的设备文件。

• 逻辑卷
一个卷组的磁盘空间可以被分配给一个或多个逻辑卷(LV,Logical Volume)。逻辑卷与分区类似,可以包含文件系统、交换区或原始数据。
逻辑卷还可以:
• 包含所有或任何一部分物理卷上的空间。
• 扩展到多个LVM物理卷。
• 如果需要,可以被改变大小,移动到不同磁盘中。
• 逻辑卷设备文件

逻辑卷设备文件存放在它们所属的卷组的目录中。每个逻辑卷有两个设备文件:一个在用字符模式访问逻辑卷时使用,另一个在用块模式访问逻辑卷时使用。例如:
• /dev/vg01/lvol01 #vg01中逻辑卷“lvol01”的块设备文件。
• /dev/vg01/rlvol01 # vg01中逻辑卷“lvol01”的逻辑设备文件。
• LVM主号和次号

每个逻辑卷和卷组设备文件必须具有主号和次号。所有LVM设备文件的主号均为64,主号与LVM内核驱动相关。次号码的前两位数字表明设备文件与那个卷组相关,最后两位数字表明与设备文件相关的逻辑卷。
例子如下:
bash-4.0# ls -lrt /dev/vg_try/*
crw-r–r-- 1 root sys 64 0x050000 Jul 27 17:13 /dev/vg_try/group
brw-r----- 1 root sys 64 0x050001 Jul 27 17:57 /dev/vg_try/lv_try00
crw-r----- 1 root sys 64 0x050001 Jul 27 17:57 /dev/vg_try/rlv_try00
brw-r----- 1 root sys 64 0x050002 Jul 27 17:57 /dev/vg_try/lv_try01
crw-r----- 1 root sys 64 0x050002 Jul 27 17:57 /dev/vg_try/rlv_try01
bash-4.0#
上面的内容中,以lv_try01为例,详细解释如下:名字:/dev/vg_try/lv_try01 主号:64 次号:0x050002
此时,次号的前面两位数字(05)表明该卷在vg_try卷组中,最后两位数字(02)表明它是lv_try01。

• PE和LE
在LVM中可分配的最小空间单元被称为“extent”,物理卷被分为多个PE(Physical Extent)。物理卷被加到卷组后即能分配使用。
逻辑卷中包含一系列顺序计数的LE(Logical Extent),每个LE只是指向磁盘上一个PE的指针。
一个卷组中PE和LE的大小是一致的,可以在创建卷组时设置。默认extent大小为4MB。

1.3 文件系统
HP-UX操作系统上,主要支持HFS(High Performance File System),JFS(Journaled File System),NFS(Network File System)和CDFS(CD-ROM File System)四种文件系统。
各个文件系统的介绍如下:

• HFS
HFS文件系统存在于大容量存储设备上,一般为磁盘驱动器。在HP-UX 10.01版本前,这是HP唯一的磁盘文件系统。文件系统大小限制为128GB。

• JFS
也被称为Veritas文件系统(VxFS),是一种扩展日志文件系统,提供快速文件系统恢复和联机备份等功能。日志中包含了最近对文件系统数据结构的修改。磁盘出错后,系统能够检查日志文件并执行需要的回滚或前滚操作。

• NFS
NFS允许不同系统通过服务器方式共享文件。NFS提供了在网络上任何地方对文件的透明访问,NFS服务器通过输出一个目录使得网络上的其他主机可以访问这个目录。NFS客户通过mount该目录来访问NFS服务器的目录。对于NFS客户端上的用户,这个目录就相当于一个本地的文件系统。

• CDFS
CD-ROM上使用的文件系统。

1.4 HA集群
MC/SG(Multi-Computer/ServiceGuard)是HP-UX操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。
MC/SG软件由三部分组成,分别是集群管理器(Cluster Manager)、包管理器(Package Manager)和网络管理器(Network Manager)。

1.4.1 集群管理器
集群由节点组成,而节点就是生产机、备份机。
只有在MC/SG的管理下,各个节点才能组成一个集群,其中的生产机节点称为集群协调器(Cluster Coordinator)。集群协调器接受各节点发送的心跳线消息,可知节点状态。
如果某个节点状态不正常,MC/SG试图形成新的集群,新的集群中不包含不正常的节点。新的集群的配置信息将传给包管理器,使得应用系统不再在不正常的节点上运行。

1.4.2 包管理器
包是运行应用所需的后台进程和服务的总称。包管理器的作用是:
决定何时在何节点运行、挂起、迁移package。
执行用户定义的控制文本从而正确的挂起和运行package。

1.4.3 网络管理器
每个节点的当前活动网卡(主网网卡)应配置其IP地址,这是静态的IP地址。静态的IP地址不会传给另一个节点,但可以传给备份网卡,所以一定不要配置备份网卡的IP地址。
此外,对于每个包应配置其唯一的IP地址,这就是浮动地址(Floating Address)。集群中的每个节点的浮动地址是相同的,并与主网静态IP地址处于同一网段。启动包时,该浮动地址将分配给主网网卡。主网网卡出现故障时,主网的静态IP地址和包地址都将切换到备份网卡。所以对于应用来讲,访问包时无须知道当前节点的静态IP地址或主机名。

1.5 管理工具
HP-UX 系统有一种名为SAM(System Administration Manager)的管理工具,这种工具功能强大,可以提供完整的联机帮助,引导用户完成系统管理任务。SAM命令在HP-UX 11i v3,调整为SMH。可以通过输出SAM或者SMH进入。

2 系统信息查看

2.1 系统物理配置信息:machinfo
使用命令:machinfo 查询,显示系统的硬件配置信息。也可以使用命令:model只查看主机型号。
在这里插入图片描述
在这里插入图片描述

2.2 操作系统版本信息:uname -a
使用命令uname -a、osinfo、swlist | grep HPUX11i查询,回显如下:
在这里插入图片描述
上图中,HP-UX的版本为B.11.31。
在HP-UX 11.11版之前,HP采用主版本号加小版本号的方式表示HP-UX版本。例如在9版本中,存在9.01、9.03、9.05等版本。
从HP-UX 11.11开始,HP改用版本号11i加上v和代表版本号的数字来标示,其中字母i用于代表其具备互联网功能,因此产生了11i v1、11i v2、11i v3等版本。
例如:HP-UX 11.11即HP-UX 11i v1。HP-UX 11.23即HP-UX 11i v2。HP-UX 11.31即HP-UX 11i v3。

2.3 HBA卡-FC
2.3.1 产品型号信息:ioscan -funC fc
使用命令:ioscan -funC fc查询。关注H/W Path、S/W State及Description信息。回显信息中,记录最后一列/dev/后面的信息,作为。
在这里插入图片描述
上图中,找到两个FC主机端口,速率为4Gbps,分配的接口id号为fcd0及fcd1。HBA型号为HP AD193-60001。这就表明主机系统已经正常识别出安装的HBA了。FC状态为CLAIMED表示可用。
S/W State状态解析:CLAIMED 可用;NO HW:设备文件在,硬件找不到;UNAVAILABLE:设备文件和硬盘在,但不可用。

2.3.2 HBA卡驱动信息及wwpn信息:fcmsutil /dev/
使用命令:fcmsutil /dev/查询,需要关注的有N_Port Port World Wide Name(wwpn信息)、Link Speed以及Driver Version。
在这里插入图片描述
上图中,wwpn号为5001438004234f56,速率为4Gb,Driver Version为fcd B.11.31.1403。

2.3.3 固件版本信息:fcmsutil /dev/ vpd
使用命令: fcmsutil /dev/ vpd 查询某个FC端口的固件版本信息。
在这里插入图片描述
上图中,fcd0端口的固件版本为04.00.70。

2.3.4 HBA超时参数:scsimgr get_attr -H -a path_fail_secs
使用命令:ioscan -P health -C disk 查看磁盘信息。关注online状态磁盘的H/W Path。回显信息中,记录H/W Path列信息为
在这里插入图片描述
使用命令:scsimgr lun_map -H | grep ‘SCSI transport protocol’ 查看磁盘是否是光纤协议。
在这里插入图片描述
上图中,显示有两条路径。
使用命令:scsimgr get_attr -H -a path_fail_secs 查看超时参数,关注current值。
在这里插入图片描述
上图中,超时参数为120秒。

2.4 iSCSI
2.4.1 IP地址:netstat -rn
使用命令:netstat -rn 查看系统的IP地址。
在这里插入图片描述
上图中,lan0接口有2个IP地址,lan1接口有一个IP地址。
使用命令:ifconfig lan* 查看接口的状态
在这里插入图片描述
上图中,接口状态为UP。

2.4.2 iSCSI软件:ioscan -kfnC iscsi
使用命令:swlist iSCSI-00 查看iSCSI的软件版本,使用命令:ioscan -kfnC iscsi 查看iSCSI软件的状态
在这里插入图片描述
上图中,iSCSI软件的版本是B.11.31.03i,软件状态为CLAIMED可用。
S/W State状态解析:CLAIMED 可用;NO HW:设备文件在,硬件找不到;UNAVAILABLE:设备文件和硬盘在,但不可用。

2.4.3 iSCSI启动器信息:iscsiutil -l
使用命令:swlist iSCSI-00或者ioscan -kfnC iscsi查询系统是否安装了iSCSI软件包。
iSCSi软件安装后,会生成iSCSI管理工具iscsiutil,其存放路径为:/opt/iscsi/bin/iscsiutil。
使用命令:iscsiutil -l查询系统iSCSI启动器信息,关注Initiator Name信息。
在这里插入图片描述
上图中,系统安装了iSCSI软件包,iSCSI 启动器名称为iqn.1986-03.com.hp:hpux.4a3de189-30d2-11df-ab2d-c7a434ef2143。

在这里插入图片描述
上图中,系统未安装iSCSI软件。

2.4.4 iSCSI目标器信息:iscsiutil -p –D
使用命令:iscsiutil -p -D收集,关注Target数量及IP Address。
在这里插入图片描述
上图中,iSCSi的目标器(即存储)有一个,IP地址是129.148.82.102,使用3260端口相连。使用的认证方式是CHAP_UNI。

2.5 磁盘信息查询

2.5.1 磁盘信息:ioscan -funNC disk
使用命令:ioscan -funNC disk查看系统上的磁盘信息。如果版本是HP-UX 11i v2和11i v1,则可以使用命令:ioscan -funC disk来查看。关注H/W Path、S/W State、Description信息。回显信息中,记录最后一列/dev/disk/ 或者 /dev/rdisk/ 后面的信息,作为。
在这里插入图片描述
上图中,主机系统找到从存储系统映射过来的6个LUN,disk22-24,disk90~92,状态为CLAIMED可用状态。以disk91为例,/dev/disk/disk91为磁盘的块设备文件名,/dev/rdisk/disk91为磁盘的字符设备文件名。

2.5.2 磁盘容量信息:diskinfo /dev/rdisk/
使用命令:diskinfo /dev/rdisk/查看磁盘的容量信息。
在这里插入图片描述
上图中disk91的容量是150GB。

2.5.3 磁盘wwn信息:scsimgr -p get_attr all_lun -a hw_path -a device_file -a wwid
使用命令:scsimgr -p get_attr all_lun -a hw_path -a device_file -a wwid 查看磁盘对应的wwn信息。
在这里插入图片描述
上图中,disk91的磁盘对应的lun的wwn信息为608c02110096fa890002e8b800000011。

2.5.4 磁盘的性能监控:iostat -t -L 2
使用命令:iostat -t -L 2查看磁盘的性能监控信息。
在这里插入图片描述

2.6 多路径-NMP

2.6.1 是否启用NMP:scsimgr get_attr -a leg_mpath_enable
使用命令:scsimgr get_attr -a leg_mpath_enable查看NMP多路径是否启动,默认该功能是启动的。
在这里插入图片描述
上图中,current和default都为TRUE,系统已经启用NMP多路径信息。

2.6.2 物理路径信息:ioscan -kfnNC tgtpath
使用命令:ioscan -kfnNC tgtpath收集,关注H/W Path、S/W State。
在这里插入图片描述
上图中,H/W Path 信息中,包含了主机FC端口及存储FC端口信息,两个信息一起组成一条路径信息,以0/2/1/0/4/0.0x240008c02196fa89 为例,0/2/1/0/4是主机的FC端口信息,240008c02196fa89是存储的目标器信息(wwpn)。
可以使用ioscan -funC fc命令查看主机的FC端口信息。

2.6.3 物理路径脱机事件信息
使用命令ioscan -kfnNC tgtpath查询物理路径H/W_Path值,再使用scsimgr get_stat -H H/W_Path查询脱机事件,回显如下:
在这里插入图片描述
脱机事件是指链路断开的次数。

2.6.4 磁盘路径信息:scsimgr lun_map -D
使用命令:ioscan -kfnNC lunpath 或 scsimgr lun_map -D /dev/rdisk/ 收集。

上图中,disk91有4条路径,Hardware Path 信息中,包含了主机FC端口及存储FC端口信息,两个信息一起组成一条路径信息,以0/2/1/0/4/0.0x222108c02196fa89.0x4002000000000000为例,0/2/1/0/4是主机的FC端口物理地址,222108c02196fa89是存储的目标器信息(wwpn),0x4002000000000000 和主机寻址方式、主机LUN ID有关的一组64bit的数值,04部分表示主机的寻址方式为:Volume Set Addressing,标红的部分002为LUN的hostid。state显示路径的状态,所有路径状态都是ACTIVE,没有启动ALUA或者ALUA配置没有生效。
在这里插入图片描述
上图中, State=ACTIVE的路径对应AO路径,State=STANDBY的路径对应AN路径,说明ALUA配置已经生效。
当存储系统映射给主机的LUN上没有任何业务的时候,主机上的路径状态会变成“UNOPEN”。此时只需要执行一下硬件扫描命令或者是对映射的LUN进行读写操作就可以恢复成“ACTIVE”的状态。

注:
在HP-UX系统上存在一种鉴权机制,系统会保存每个LUN的WWN信息,执行ioscan进行LUN扫描的时候,会对这些LUN的WWN进行检查,当发现LUN的WWN改变的时候,就会导致鉴权失败,后续的LUN也无法使用。
HP-UX主机要求存储报给主机的LUN的host id从0开始,主机记录这个host id 0的LUN信息,如果这个LUN的信息发生变化,则主机会将后续的所有LUN对应的磁盘置为不可用状态。当存储报给主机的LUN的host id不从0开始时,会给主机一个lunz的信息(代替host id 0的LUN),主机记录lunz的信息,如果lunz发生变化,则主机会将后续的所有LUN对应的磁盘置为不可用状态。

2.6.5 磁盘路径策略信息:scsimgr get_attr -D
使用命令:scsimgr get_attr -D /dev/rdisk/查看磁盘的详细路径策略信息(参数很多,信息很长),可以使用:scsimgr get_attr -D /dev/rdisk/ -a alua_enabled查看指定参数值。
在这里插入图片描述在这里插入图片描述
上图中,disk91负载均衡策略为round_robin,优选路径没有配置,ALUA配置已经开启(开启ALUA后,默认使用ALUA策略)。

可使用scsimgr get_attr -D /dev/rdisk/ -a alua_enabled命令查看磁盘的ALUA配置。
在这里插入图片描述

2.6.6 磁盘配置属性信息:scsimgr get_info -D
使用命令scsimgr get_info -D /dev/rdisk/查看,关注World Wide Identifier (WWID)(磁盘的WWN),Serial number(存储的sn),I/O load balance policy(负载均衡策略),LUN access type(是否开启ALUA)。
在这里插入图片描述
上图中,磁盘的wwn为648435a10057bd3507630b4300000000,存储的sn为2102350SHS10G7000009,存储厂商为huawei,磁盘的负载均衡策略为round_robin,LUN access type属性显示为T10 Asymmetric Active-Active,表示支持ALUA,Asymmetric logical unit access supported表示隐式ALUA。
在这里插入图片描述
上图中,磁盘的负载均衡策略I/O load balance policy为round_robin;未开启ALUA属性。

2.6.7 磁盘路径超时配置信息
使用命令:ioscan -P health -C disk确认磁盘H/W Path后,再用命令:scsimgr get_attr -H H/W_Path_ID -a path_fail_secs显示磁盘的超时时间,关注current参数。
在这里插入图片描述
上图中,超时参数为120秒。

2.6.8 其他超时参数信息
使用命令kctune asyncdsk_io_timeout、scsimgr get_attr -N /escsi/esdisk -a esd_secs、scsimgr get_attr收集,回显如下:
在这里插入图片描述

2.6.9 多路径配置文件-无
HP-Unix无统一配置文件,需要单个磁盘进行策略修改。

2.7 卷信息查询

2.7.1 物理卷信息:pvdisplay -l /dev/disk/
使用命令:pvdisplay -l /dev/disk/查看磁盘是否创建物理卷。
在这里插入图片描述
物理卷创建成功,则LVM_Disk的值为yes,否则为no。

2.7.2 物理卷组信息及状态:vgdisplay -v
使用命令:vgdisplay查看所有的vg信息,使用命令:vgdisplay -v显示所有vg的详细信息(包括pv及lv的信息),使用vgdisplay -v /dev/vgid显示具体某个vg的详细信息。
在这里插入图片描述
上图中,vg的状态为可使用,其下有一个pv为/dev/disk/disk18,其上有一个lv为/dev/vg_lisa0/lv_lisa00,状态都为科使用。

2.7.3 Lv信息及状态:lvdisplay /dev/vgid/lvid
使用命令lvdisplay /dev/vgid/lvid查看lv的信息及状态。
在这里插入图片描述
上图中,lv的状态为可使用/已同步。

2.7.4 文件系统信息: bdf
使用命令:bdf 显示文件系统信息。
在这里插入图片描述
上图中,文件系统lisafs0大小为1GB,基本未使用。

2.7.5 查看挂载信息: cat /etc/fstab
使用命令:cat /etc/fstab 查看当前系统上已有的挂载信息
在这里插入图片描述

2.7.6 查看挂载版本信息: mount -v
使用命令:mount -v 查看挂载的版本信息
在这里插入图片描述

2.8 集群信息
使用cmviewcl –v命令查看集群状态。

2.9 系统日志信息:cat /var/adm/syslog/syslog.log
使用cat /var/adm/syslog/syslog.log查看系统日志,必要时下载该日志文件。
在这里插入图片描述

3 Oracle数据库应用
需要使用Oracle ASM管理员账号查询ASM卷组相关配置参数

3.1 判断oracle数据库是否使用ASM及获取ORACLE_SID信息
使用命令:ps -ef | grep pmon确认oracle数据库是否使用ASM,+ASM回显表示使用ASM磁盘,反之使用文件系统。使用ASM磁盘组时,在回显中记录最后一列asm_pmon_后的字符,即为ASM实例<ORACLE_SID>值。
在这里插入图片描述
上图中,ASM的管理员账号为grid。ASM实例名称即ORACLE_SID值为+ASM
记录结果其值为“+ASM”表示Oracle数据库是单机版,其值为“+ASM1”表示是RAC环境,本机为节点1,其值为“+ASM2”表示是RAC环境,本机为节点2;

3.2 获取ASM实例ORACLE_HOME值
执行命令ps -ef | grep ocssd.bin,记录回显中关键字ocssd.bin行以下各列信息:
在这里插入图片描述
记录第一列字符,即为ASM实例管理用户
记录最后一列/bin/ocssd.bin之前的路径字符,即为ASM实例<ORACLE_HOME>值

3.3 设置环境变量,进入数据库
执行命令su - grid,切换用户至ASM实例管理用户下(grid为查询到的UID用户),并export设置ORACLE_HOME、ORACLE_SID环境变量,然后以sqlplus / as sysasm 登录ASM实例。
su - grid:grid为记录的ASM实例管理用户
export ORACLE_SID=<ORACLE_SID>
export ORACLE_HOME=<ORACLE_HOME>
在这里插入图片描述

3.4 设置SQL回显的显示参数
进入数据库后获取信息之前,设置显示参数,格式化SQL查询输出格式,使用如下SQL语句(可根据实际输出调整参数值)
set linesize 1000
col path for a40
col name for a15
col value for a20
col describe for a100
在这里插入图片描述

3.5 查询数据库版本信息:select * from v v e r s i o n ; 使用 S Q L 语句: s e l e c t ∗ f r o m v version; 使用SQL语句:select * from v version;使用SQL语句:selectfromvversion; 查询数据库版本信息。数据库版本为:11.2.0.3、11.2.0.4或者12.1.0.1时,PST的超时参数默认是15秒,存储升级有中断业务的风险。
在这里插入图片描述
上图中,oracle数据库的版本为11.2.0.4

3.6 查询ASM磁盘组类型
使用SQL语句:select group_number gno,name,state,type,total_mb,free_mb from v$asm_diskgroup; 查询ASM磁盘组类型信息,ASM磁盘有3种类型:high、normal、extern;只有high/normal类型磁盘组存在PST心跳踢盘,导致此ASM磁盘组上的业务中断。
在这里插入图片描述
上图中DATA磁盘的类型为normal,grid磁盘的类型为extern。

3.7 查询Oracle数据库ASM磁盘组子磁盘信息
使用SQL语句:select name,path,group_number, disk_number,mount_status,header_status,mode_status,state from v$asm_disk; 查询Oracle数据库ASM磁盘组子磁盘信息。
在这里插入图片描述
上图中,asm的磁盘组有3个子磁盘,状态都是normal的,第一列显示了子磁盘的路径信息。

3.8 查询ASM磁盘组PST超时时间
使用SQL语句:select a.ksppinm name,b.ksppstvl value,a.ksppdesc describe from x k s p p i a , x ksppi a,x ksppia,xksppcv b where a.inst_id = userenv(‘instance’) and b.inst_id = userenv(‘instance’) and a.indx = b.indx and a.ksppinm like ‘_asm_hbeatio%’ escape ‘’;查询ASM超时时间,11.2.0.3~12.1.0.1 默认是15秒,其他版本默认120秒,回显如下:
在这里插入图片描述

3.9 查看磁盘的权限信息:ls -al /dev/rdisk
使用命令:ls -al /dev/rdisk 查看物理磁盘及逻辑磁盘权限信息。
在这里插入图片描述
上图中,disk磁盘为系统使用,权限为sys,ora被Oracle数据库ASM磁盘组使用,其管理员为grid,权限为oinstall。

3.10 ASM日志信息查询
在ASM系统管理员账户grid下,
单机数据库使用cat $ORACLE_BASE/diag/asm/+asm/+ASM/trace/alert_+ASM.log查询
RAC数据库使用cat $ORACLE_BASE/diag/asm/+asm/+ASM1/trace/alert_+ASM.log查询(路径中+ASM1为节点ID,节点1为+ASM1、节点2为+ASM2)
在这里插入图片描述
在这里插入图片描述

4 数据库磁盘配置关系
4.1 Oracle数据库磁盘与LUN的对应关系
Oracle数据库下面使用SQL语句:select name,state,path from v$asm_disk; 查看Oracle数据库使用的子磁盘信息;在这里插入图片描述
上图中,GRID磁盘组有3个子磁盘,DATA磁盘组有16个子磁盘。记录子磁盘的PATH路径信息。以/dev/rdisk/ora_data_02为例,进行下一步信息查看。

使用命令:ioscan -funNC disk 查看磁盘信息,查看Description中的磁盘信息,与上一步获取的信息对应查看。
在这里插入图片描述
上图中,/dev/rdisk/ora_data_02的磁盘对应磁盘是disk91。进行下一步信息查看。

使用命令:scsimgr -p get_attr all_lun -a hw_path -a device_file -a wwid 查看磁盘的wwn信息。
在这里插入图片描述
上图中,LUN的wwn信息为608c02110096fa890002e8b800000011。
通过以上信息查看,ASM子磁盘和LUN信息已经对应。

4.2 数据库存信息查询
4.2.1 确定数据库是单机版还是集群版:ps -ef | grep pmon
(SSH登陆主机收集)主机使用命令:ps -ef | grep pmon确认oracle数据库是否使用ASM,+ASM回显表示使用ASM磁盘,反之使用文件系统。
在这里插入图片描述
上图中,ASM的管理员账号为grid。ASM实例名称为+ASM
记录结果其值为“+ASM”表示Oracle数据库是单机版,其值为“+ASM1”表示是RAC环境,本机为节点1,其值为“+ASM2”表示是RAC环境,本机为节点2;

(JDBC收集信息)ASM管理员用户使用SQL语句:show parameter instance_name 查看。
在这里插入图片描述

4.2.2 单机版
(JDBC收集信息)使用SQL语句:show parameter local_listener 获取Oracle数据库的监听IP地址,确定具体物理主机。再使用SQL语句:select instance_name,host_name from v$instance; 获取主机名。
在这里插入图片描述
在这里插入图片描述
上图中,监听地址为100.148.149.21,主机名称为rac01。

(SSH登陆主机查询)主机上使用命令:ifconfig -a 查看主机的IP地址,使用命令:hostname 查看主机名。
在这里插入图片描述
通过 主机IP地址和主机名 确认数据库与主机的关联关系,如果此数据仍然有重复,则需要再增加磁盘信息进行精准确认,参考

4.2.3 获取ASM实例ORACLE_HOME: ps -ef | grep ocssd.bin
使用命令:ps -ef | grep ocssd.bin
在这里插入图片描述
上图中,ASM实例ORACLE_HOME值为/u01/oracrs/product/11gR2/grid。

4.2.4 集群状态: O R A C L E H O M E / b i n / c r s c t l c h e c k c l u s t e r 使用命令: ORACLE_HOME /bin/crsctl check cluster 使用命令: ORACLEHOME/bin/crsctlcheckcluster使用命令:ORACLE_HOME /bin/crsctl check cluster 查看集群状态信息
在这里插入图片描述
上图中,集群状态为online(3个状态均看)

4.2.5 节点状态查询: O R A C L E H O M E / b i n / o l s n o d e s − s 使用命令: ORACLE_HOME/bin/olsnodes -s 使用命令: ORACLEHOME/bin/olsnodess使用命令:ORACLE_HOME/bin/olsnodes -s
在这里插入图片描述
上图中,RAC集群有2个节点,都为active状态。

4.2.6 集群名称查询: O R A C L E H O M E / b i n / c e m u t l o − n 使用命令: ORACLE_HOME /bin/cemutlo -n 使用命令: ORACLEHOME/bin/cemutlon使用命令:ORACLE_HOME /bin/cemutlo -n
在这里插入图片描述
上图中,集群名称为 rac-cluster

4.2.7 集群IP地址查询: srvctl config scan
在ASM管理员用户下(执行命令:su - grid),使用命令:srvctl config scan在这里插入图片描述
上图中,100.148.87.31即为集群的集群IP地址。

4.2.8 集群单节点IP地址及状态信息: srvctl config nodeapps
在ASM管理员用户下,使用命令:srvctl config vip -n 查看节点IP地址,使用命令:srvctl status vip -n 查看节点状态。
在这里插入图片描述
或者使用命令:srvctl config nodeapps
在这里插入图片描述
上图中,VIP地址为100.148.87.29/30。

附:系统常用维护命令
1、硬件扫描命令:ioscan
在这里插入图片描述

2、iSCSI
2.1 启动器IQN修改
使用命令iscsiutil -i -N iqn.1986-03.com.hp:louis2018.1234567890修改iSCSI的IQN。
iSCSI Initiator Name命名规则如下:
格式为iqn.domaindate.reverse.domain.name:optional name,IQN名字中,只允许出现下面的字符:
特殊字符:破折号(‘-’),点号(‘.’),冒号(‘:’)
小写英文字母:‘a’…‘z’
阿拉伯数字:‘0’…‘9’
此外,还要求名字的字符数长度不得超过223。
2.2 添加目标IP
使用iscsiutil -a -I 192.168.5.6添加目标IP。

3、 NMP多路径启用
如果发现系统的NMP状态为false,则可以使用下面的命令进行调整。
scsimgr set_attr -a leg_mpath_enable=true
scsimgr save_attr -a leg_mpath_enable=true

如果发现单个LUN的NMP状态为false,则可以使用下面的命令进行调整。第一条设置命令临时生效,重启主机后就会失效。第二条设置命令是永久生效。二者选一即可。
scsimgr set_attr -D /dev/rdisk/disk24 -a leg_mpath_enable=true
scsimgr save_attr -D /dev/rdisk/disk24 -a leg_mpath_enable=true

4、 重启主机命令
使用命令:shutdown –ry 0 重启主机。

5、 磁盘漂移
HP 11I V1,V2中磁盘块设备地址方式为Legacy Hardware Paths,V3系统中有两种块设备地址生成方式,除了Legacy Hardware Paths外,还支持LUN Path Hareware Path,这两种地址生成规则不同,分别加以介绍。
5.1 LUN Path Hareware Path

  • 磁盘的块设备地址
    在这里插入图片描述
    各字段 含义
    0/6/1/0/4/0 HBA卡端口的物理地址
    0x20020022al0b7bb1 Target的port wwn
    0x400000000000000 和主机寻址方式、主机LUN ID有关的一组64bit的数值,04部分表示主机的寻址方式为:Volume Set Addressing标红的部分000为LUN的hostid

  • 磁盘盘符漂移分析
    LUN的块设备地址与HBA卡端口物理地址、tgt的port wwn及host lun id相关,这三个参数发生变化,可能会盘符漂移。

  1. Target port wwn
    当Target port wwn发生变化,主机端会打印提示信息:
    在这里插入图片描述
    盘符未出现漂移,仍可正常读写,此时查看LUN的路径信息会显示两条路径,之前的那条状态为failed,如下图所示。
    在这里插入图片描述

  2. Lun host_id
    LUN 的主机lun_id发生变化后,主机端仍可对LUN正常读写,读写之前主机会对LUN下发查询命令更新LUN信息,此时查看LUN的物理路径,发现原来的物理路径状态变为failed,由新的host id生成了新的物理路径。如下图所示:
    在这里插入图片描述

  3. HBA卡端口物理地址
    HBA卡端口物理地址变化后,主机端会打印提示信息:
    在这里插入图片描述
    此时LUN变得不可读写,需要添加启动器后,在主机端执行扫LUN操作,LUN盘符未漂移,恢复为可读写状态,此时查看LUN的物理路径,由新的HBA卡端口物理地址生成新的物理地址。如下图所示:
    在这里插入图片描述

  • 小结
    LUN Path Hareware Path方式中,HBA卡端口物理地址、tgt的port wwn及host lun id参数发生变化,都会导致主机端为LUN生成一条新的物理路径,原来的物理路径状态变为failed。但是物理路径的变化都不会导致盘符漂移。

5.2 Legacy Hardware Paths

  • 磁盘的块设备地址
    在这里插入图片描述
    字段 含义 具体含义
    0/3/1/0/4/0 Adapter HBA卡端口物理地址
    8 Domain 交换机模式时为tgtN_Port_ID的第一个字节,私有仲裁环模式时固定为8
    0 Area 交换机模式时为tgt N_Port_ID的第二字节,私有仲裁环模式时值固定为0
    1 Port 由HBA卡的拓扑模式、LUN寻址方式和阵列端端口决定
    0 Bus 由HBA卡的拓扑模式、LUN寻址方式和阵列端端口信息决定
    0 Target 由HBA卡的拓扑模式和LUN寻址方式决定
    0 LUN 由LUN寻址方式决定,LUN寻址方式采用Logical Unit Addressing方式,该值为主机LUN ID

  • 磁盘盘符漂移分析
    字段 - 变化是否会引起盘符漂移 - 恢复措施
    Adapter - 是 - 阵列端添加启动器,主机端执行扫LUN命令:ioscan,insf -e
    Domain - 是 - 重新扫描磁盘:ioscan,insf -e
    Area - 是 - 重新扫描磁盘:ioscan,insf -e
    Port - 是 - 重新扫描磁盘:ioscan,insf -e
    Bus - -
    Target - -
    LUN - 是 - 重新扫描磁盘:ioscan

注意:
1.变更组网会让Domain和Area字段发生变化。
2.更换阵列连接到交换机的端口会让Area值变化。
3. 换插阵列端端口会让port值发生变化。
3.更换主机连接到交换机的端口,以上字段均不会发生变化,盘符不会出现漂移。
4. Bus和Target暂时没有找到会触发其改变的场景,应该是是属于主机内部的通道上的硬件地址,一般情况下应该不会改变。

  • 小结
    Legacy Hardware Paths方式中,参数发生变化都会导致盘符发生漂移,LUN状态变得不可以读写,需要在主机端重新扫描磁盘,生成新的块设备地址。
  • 31
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值