还是年前的时候,绩效系统一直告警,查看了下,库上一直报ora-4031,很常见的错误,当时下意识的认为是内存不足了。
应该绩效手上在exadata一体机上,该一体机上还装了其他几套系统,内存资源比较紧张。
当时flush了下shared_pool,但没啥效果,因为是rac环境,便依次重启了实例,故障就消失了。
没过多久,绩效数据库又出现了这样的情况,共享池不足,就感觉不对劲了,但当时是年底了,马上就过年了,没啥心思探究。
结果过年期间,同属于exadata上crm系统也出现这样的情况,基本确定确实有问题了。
年后回来事情一直比较多,今天下午得空排查了一下,发现share pool一直在增长。大概可以推算出,由于共享池无节制的增长,导致buffer cache一直在被调缩,
直至share pool占据了绝大多数的sga,无法再增长,继而报错,导致数据库无法访问。
数据库版本及补丁
12.2.0.1181016
在MOS上搜了下,相关bug还挺多,到处瞧到处看,找到如下文档:
Bug 27824540 - ORA-4031 Error In Shared Pool Due To Leakage Of 'ges resource dynamic' Chunk In RAC Env (Doc ID 27824540.8)
Too many objects "ges resource dynamic" were allocated in the shared pool eventually failing with errors like: ORA-04031
Monitoring "ges resource dynamic" growth via the following shows a general upward trend:
select inst_id, name, round(bytes/(1024*1024*1024),1) in_gb from gv$sgastat where name = 'ges resource dynamic';
- example after an instance restart:
INST_ID NAME IN_GB
---------- -------------------------- ----------
1 ges resource dynamic