墨墨导读:为了及时共享行业案例,通知共性问题,达成共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》,通过对过去一段时间的知识回顾,故障归纳,以期提供有价值的信息供大家参考。同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的支持信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。
数据技术嘉年华,十周年盛大开启,点我立即报名!大会以“自研·智能·新基建——云和数据促创新 生态融合新十年” 为主题,相邀数据英雄,总结过往十年历程与成绩,展望未来十年趋势与目标!近60场演讲,大咖云集,李飞飞、苏光牛、林晓斌、黄东旭...,快来pick你喜欢的嘉宾主题吧!
墨天轮文档:《云和恩墨技术通讯(10月刊)》:https://www.modb.pro/doc/6459
(复制到浏览器中打开或者点击文末左下角“阅读原文”立即下载)
这里推荐一个常见的问题,希望对大家有借鉴作用。
故障:HAIP在两个私网网卡上发生互换,导致ASM实例启动失败-罗杨杰
ORACLE从11.2.0.2之后提供了HAIP来实现网络冗余和负载均衡。HAIP顾名思义就是一个(或多个)IP地址。Oracle会自动在集群的每一块私网网卡上绑定一个169.254.XX.XX 网段的IP地址,这个IP地址被称为HAIP,数据库实例(ASM 实例也同样适用)之间在进行通信时,会通过这个Oracle绑定的IP地址来完成。本文介绍的是由于HAIP在两个私网网卡上发生互换,导致ASM实例启动失败。
1. 问题概述
数据库的一节点在重启crs后发现ora.asmgroup资源无法正常启动。该数据库版本为19.8,此问题此前已经多次出现。一节点集群crsd和cssd等运行正常,但是ora.asmgroup资源出现offline现象。
2. 故障根源
ASM实例在9月21日17点32分58秒被LMON进程发起终止:
2020-09-21T17:32:58.644321+08:00
No connectivity to other instances in the cluster during startup. Hence, LMON is terminating the instance. Please check the LMON trace file for details. Als