墨墨导读:为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考。同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的支持信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。
墨天轮文档:《云和恩墨技术通讯(11月刊)》:https://www.modb.pro/doc/6950
(复制到浏览器中打开或者点击文末左下角“阅读原文”立即下载)
这里推荐一个常见的问题,希望对大家有借鉴作用。
故障:OCR无法正常读取导致节点宕机-陆发圣
“OCR存储了所有与集群,RAC数据库相关的配置信息。并且这种配置信息都是多个节点进行共享。所以OCR会存放在共享磁盘上。OCR包含了节点成员信息,数据库实例,节点,以及其他映射关系,资源配置信息等。本文主要介绍的是OCR磁盘异常,导致节点宕机。
1. 问题概述
数据库系统节点1集群资源突然故障,在通过重启集群资源也未能恢复(无法找到表决磁盘)。
2. 过程分析
2.1 故障根源
通过与主机工程师的交流和日志分析,由于hba光纤口断掉,而且由于主机上只配了一块HBA卡,没有冗余,从而导致主机无法与存储磁盘正常通信。因此节点1无法读取OCR表决盘,导致节点1集群资源宕机,从而引发数据库意外宕机。
Nov 16 10:04:3 |