这两天配置了一个三节点的RAC环境,想起前一段时间Thomas Zhang给我出的一个题目,配置一个三节点RAC环境的复杂负载均衡以及Transparent Application Failover的服务名。现在有环境了,可以将给出验证后的结果了。
这篇解决实例1和实例2连续失败导致的ORA-3113错误。
灵活实现RAC三节点的负载均衡及TAF配置(一):http://yangtingkun.itpub.net/post/468/482683
灵活实现RAC三节点的负载均衡及TAF配置(二):http://yangtingkun.itpub.net/post/468/482724
灵活实现RAC三节点的负载均衡及TAF配置(三):http://yangtingkun.itpub.net/post/468/487416
前面配置的TNSNAMES.ORA满足了绝大部分的要求,但是有时如果实例1和实例2先后关闭,则客户端在切换到另一个实例后,再次尝试TAF的时候可能无法正确的连接到实例3上,而是报错ORA-3113错误:
SQL> CONN TEST/TEST@SERVICEA
已连接。
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
SELECT INSTANCE_NAME FROM V$INSTANCE
*
ERROR 位于第 1 行:
ORA-03113: 通信通道的文件结束
在上面3个SQL执行之间,依次在后台运行了下面的关闭实例的命令:
bash-2.03$ srvctl stop inst -d testrac -i testrac1
bash-2.03$ srvctl stop inst -d testrac -i testrac2
除了上面的ORA-3113错误,有时还可能出现ORA-1089错误:
SQL> CONN TEST/TEST@SERVICEA
已连接。
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
SELECT INSTANCE_NAME FROM V$INSTANCE
*
ERROR 位于第 1 行:
ORA-01089: 正在进行紧急关闭 - 不允许进行任何操作
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
SELECT INSTANCE_NAME FROM V$INSTANCE
*
ERROR 位于第 1 行:
ORA-03114: 未连接到 ORALCE
后台执行的关闭实例的操作和前面的例子完全一样,而得到的结果和刚才不一样。这是由于这次在SQLPLUS中不断的执行查询,虽然已经执行了实例关闭的命令,但是Oracle后台还没有来得及关闭当前会话,导致会话仍然可以继续执行,因此返回了多次testrac1和多次testrac2的结果。显然ORA-1089错误也是由于这个原因,如果按照时间顺序排列,会话运行先后可能碰到ORA-1089、ORA-3113和ORA-3114错误。
怀疑在执行TAF的时候,Oracle并没有在FAILOVER发生的时候根据BACKUP指定服务名去动态的找到连接的信息,这个连接信息很可能是早就确定好的,等到FAILOVER的时候只是一个连接动作,发现连接不了,就直接报错了。
于是将TNSNAMES.ORA中的SERVICEA_BACKUP服务名进行了调整,将前两个FAILOVER的BACKUP配置设置为预连接方式,避免在FAILOVER方式的时候找到一个不正确的实例进行连接:
SERVICEA_BACKUP =
(DESCRIPTION_LIST =
(LOAD_BALANCE = no)
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 172.25.198.224)(PORT = 1521))
)
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = TESTRAC)
(INSTANCE_NAME = TESTRAC1)
(FAILOVER_MODE =
(TYPE = SELECT)
(METHOD = PRECONNECT)
(BACKUP = SERVICEA_BACKUP)
)
)
)
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 172.25.198.225)(PORT = 1521))
)
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = TESTRAC)
(INSTANCE_NAME = TESTRAC2)
(FAILOVER_MODE =
(TYPE = SELECT)
(METHOD = PRECONNECT)
(BACKUP = SERVICEA_BACKUP)
)
)
)
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 172.25.198.227)(PORT = 1521))
)
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = TESTRAC)
(INSTANCE_NAME = TESTRAC3)
(FAILOVER_MODE =
(TYPE = SELECT)
(METHOD = BASIC)
(BACKUP = SERVICEA)
)
)
)
)
下面再次进行刚才的测试:
SQL> CONN TEST/TEST@SERVICEA
已连接。
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac3
后台对应的仍然是关闭实例1和实例2的操作:
bash-2.03$ srvctl start inst -d testrac -i testrac2,testrac1
bash-2.03$ srvctl stop inst -d testrac -i testrac1
bash-2.03$ srvctl stop inst -d testrac -i testrac2
当然这个方法不能治本,继续前面的测试:
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac3
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac1
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
INSTANCE_NAME
----------------
testrac2
SQL> SELECT INSTANCE_NAME FROM V$INSTANCE;
SELECT INSTANCE_NAME FROM V$INSTANCE
*
ERROR 位于第 1 行:
ORA-03113: 通信通道的文件结束
后台对应的操作:
bash-2.03$ srvctl start inst -d testrac -i testrac2,testrac1
bash-2.03$ srvctl stop inst -d testrac -i testrac3
bash-2.03$ srvctl stop inst -d testrac -i testrac1
bash-2.03$ srvctl start inst -d testrac -i testrac3
bash-2.03$ srvctl stop inst -d testrac -i testrac2
描述一下上面的测试过程。当前会话连接到实例3上,下面启动实例1和实例2,并关闭实例3。发现会话切换到实例1上。然后关闭实例1,这时会话切换到实例2上。将实例3启动,然后关闭实例2,如果TAF工作正常,应该可以切换到实例3上,但是这里出现了ORA-3113错误。
显然Oracle只是在第一次连接的时候尝试登陆BACKUP指定的预连接实例,如果连接不上,Oracle在当前会话需要执行TAF的时候报错。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/4227/viewspace-609766/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/4227/viewspace-609766/