OOM的原理和解决方案
一、metaspace区内存溢出导致的oom
Metaspace区域一般很少发生内存溢出,如果发生,一般是下面两个原因
原因:
- 不懂的人,在线上系统对Metaspace区域直接使用默认参数,根本不设置大小,默认大小才几十MB,对于一些大的系统来说是不够的
- 系统代码里使用很多cglib之类的技术动态生成一些类,一旦代码中没有控制好,很容易把Metaspace给塞满,引发内存溢出
解决方案:
- 对上面第一种原因的方案:给上线系统设置对应的Metaspace大小,推荐值是512MB,一般就够用了
- 对上面第二种原因的方案:代码层面修改
二、栈内存溢出导致的oom
栈内存一般不会发生内存溢出,如果发生了,一般是因为代码层面有递归方法调用或者死循环调用,代码层面的bug。
注意递归方法的终止条件。
三、堆内存溢出导致的oom
一般就是下面的两个原因,系统负载过高或者内存泄露导致的内存溢出
原因:
- 系统承载高并发请求,导致大量对象存活,此时继续存放新的对象,内存实在放不下了,oom
- 内存泄露,莫名其妙很多对象没有及时取消对他们的引用,触发GC后还是无法回收,引发内存溢出,放不下了
总结:触发老年代GC的时机
一、老年代剩余可用空间小于新生代全部对象大小,如果没开启空间担保参数,直接触发Full GC,所以一般开启空间担保参数
二、老年代可用空间小于历次新生代GC后进入老年代的平均对象大小,会提前进行Full GC
三、新生代minor GC后,存活的对象大小老年代剩余空间,也会进行Full Gc
四、老年代使用率超过-XX:CMSInitiatingOccupancyFaction设置的比率
五、只要有新对象进入老年代,如果此时老年代剩余空间不足,就进行Full GC