故障说明
在12月27日凌晨5点左右,客户收到业务告警业务无法正常运行,6点半左右将service name服务移到2节点,并且重启1节点主机,恢复业务。
故障描述
12月27日故障,工程师分析故障时间点数据库alert日志发现大量缓冲区不足的报错,从12月27日00:54分开始一直报错到早上6点半重启数据库。
故障分析
12月27日的报错完全匹配上oracle mos上的(Doc ID 2041723.1)
故障报错
官方mos故障介绍
官方说法此问题的原因为网络缓存不足。
建议
-
根据官方建议修改内核参数vm.min_free_kbytes,值为节点数总内存0.4%(作用为强制Linux 系统最低保留多少空闲内存