问题背景:
在Oracle RAC19c的三节点集群进行第四个节点的添加,完成节点添加之后,集群状态正常但新节点的ASM实例没有启动,后面分析发现是由于ASM实例使用了Flex ASM功能,而默认的Flex ASM只能启动3个实例,导致第四个节点的ASM实例无法启动。
问题:
在Oracle RAC19c的三节点集群进行第四个节点的添加,完成节点添加之后,集群状态正常但新节点的ASM实例没有启动。
问题原因:
ASM实例使用了Flex ASM功能,默认的Flex ASM的基数为3,只能启动3个实例,导致第四个节点的ASM实例无法启动。
问题分析:
查看加完节点4的集群状态,集群状态4个节点的状态正常,但ASM实例、磁盘组服务只有三个节点的服务drora01-03。
分析crs的asm服务启动日志ohasd_oraagent_grid.trc并没有发现异常,asm实例的alert.log则没有任何的写入。
查看集群asm实例的配置,可以看到当前asm实例的默认配置数量为3
查看asm的模式,当前开启了flex asm
Flex ASM是Oracle从12c推出的新功能,Flex ASM将asm实例与集群节点主机拆开,集群节点可以访问其他远程节点的ASM实例来访问ASM存储,而不像以前的版本asm客户端(数据库、ACFS、ADVM)只能通过在同一主机上的asm实例来访问asm存储,默认的Flex ASM实例基数为3,从12.2版本开始,asm实例默认会配置Flex ASM功能。
Flex ASM的主要作用:
1 可以用更少的Oracle asm实例群集支持更多的数据库客户端,减少整个集群的Oracle asm资源消耗
2 进行故障转移,如果运行asm实例的服务器出现故障,集群将在其他服务器上启动新的ASM实例以保持实例基数,并且将故障节点的连接重新连接到正常节点上的asm实例。
到这里,我们可以确认由于集群使用了Flex ASM功能,而默认的Flex ASM的基数为3,只能启动3个实例,所以导致了第四个节点的ASM实例无法启动。
问题解决:
那么如何启动第四个节点的ASM实例呢?
1 调整默认的Flex ASM实例基数,将基数调整为节点数量4或者ALL
srvctl modify asm -count 4 or srvctl modify asm -count ALL
调整完之后,节点4的asm实例可以正常启动
2 关闭其他节点的一个asm实例,节点4的asm实例将会自动启动以保持ASM集群有3个实例