下载丨云和恩墨技术通讯:OCR无法正常读取导致节点宕机

本文分析了一起因OCR无法正常读取导致的数据库节点宕机故障。故障源于HBA光纤口断掉,导致节点无法与存储通信。日志显示大量I/O错误,最终引发数据库宕机。解决方案包括重启主机以恢复服务,并建议重要系统配置冗余设备以防止类似单点故障。
摘要由CSDN通过智能技术生成

墨墨导读:为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考。同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的支持信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。

墨天轮文档:《云和恩墨技术通讯(11月刊)》:https://www.modb.pro/doc/6950(复制到浏览器中打开或者点击文末左下角“阅读原文”立即下载)

这里推荐一个常见的问题,希望对大家有借鉴作用。

故障:OCR无法正常读取导致节点宕机-陆发圣


“OCR存储了所有与集群,RAC数据库相关的配置信息。并且这种配置信息都是多个节点进行共享。所以OCR会存放在共享磁盘上。OCR包含了节点成员信息,数据库实例,节点,以及其他映射关系,资源配置信息等。本文主要介绍的是OCR磁盘异常,导致节点宕机。

1. 问题概述

数据库系统节点1集群资源突然故障,在通过重启集群资源也未能恢复(无法找到表决磁盘)。


2. 过程分析

2.1 故障根源

通过与主机工程师的交流和日志分析,由于hba光纤口断掉,而且由于主机上只配了一块HBA卡,没有冗余,从而导致主机无法与存储磁盘正常通信。因此节点1无法读取OCR表决盘,导致节点1集群资源宕机,从而引发数据库意外宕机。

Nov  16 10:04:3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值