首先介绍一下软硬件环境:

2台rx2800i2安装有HP-UX 11.31系统

每台rx2800i2都有两块单口8GB FC HBA卡,分别连接到两台FC交换机上,比如说server1光纤口1连接到交换机1,光纤口2连接到交换机2;server2光纤口1连接到交换机1,光纤口2连接到交换机2。

存储用的是P2000(同样的故障出现在P6350),上有两个控制器,每个控制器有一个光纤口,分别连到光纤交换机上。这是典型的SAN存储网络环境。

 

 

现在要安装Oracle RAC11.0.6.0,在安装集群的时候,用命令sar -d  1 100 查看时发现I/O 100%,而且数据库集群安装进行不下去,按照以往的经验,集群软件安装大约在1个小时,但是今天从下午2点一直到4点,只进行到34%,期间I/O 一直100%。

 

以上的情况介绍完毕,我赶到现场,发现跟此相关的故障就在于server1光纤卡1的指示灯显示不正常,正常情况下应该是常亮橙黄灯,但此时是闪烁橙黄灯。于是我就把SFP模块进行插拔,显示灯不变,在等了将近2个小时,集群安装进度没有任何变化,在聊了很久之后,因为之前有遇到相类似的故障,最后决定把一直在闪的灯拔掉。

 

拔掉之后,IO立马就下来,而且在短短3分钟之内,进度就到了47%,说明性能恢复正常。

 

那么问题出来了,前后的差异就在于我拔了光纤卡1上的光纤线,按道理来讲,不管是线有问题还是线两端的端口模块有问题,就算这条线路不通了,还有其他两条线路预备着,不至于导致数据库安装延时;可事实上,我拔掉了线路之后,数据库安装反而正常,这该如何解释。