这是第一次把问题分析的总结记录下来,一是记录下做备忘,二是把问题分析的过程和总结梳理下。
一共在两个系统碰过因为加密导致OOM的问题:
第一次遇到这个问题的时候什么也不懂,只知道浑身发抖心乱跳……。不知道问题产生的原因更不知道该从何查起,运维同事给打了份dump日志,对我来说什么用都没有。没办法只能请当时组里的牛人帮看。然后他就告诉我把一个变量设置成静态的,修改后,发布到服务器上果然没有再内存飙升直至OOM了。当时也没有请教下问题的根本原因是什么,只是问题解决就松了一口气。
第二次是另外一个系统,但是那个系统不像第一次碰到的系统那样发布上去碰到访问高峰就OOM。这个系统问题发现的比较有意思,为什么说有意思呢?因为问题一直都存在,只不过加密工具类调用的次数少,再加上这个系统发布比较频繁,所以一直没有OOM。直到有一次半个月没有更新发布才报了OOM。
后来开始学习了解jvm,尝试着去模拟重现当时的场景,然后分析系统OOM的原因。两次问题的共同点都是多次调用加密类导致的。所以问题应该就在这个加密类。
模拟的代码如下:
public static voidencrypt(){ try{ Cipher cipher = Cipher.getInstance("RSA", newBouncyCastleProvider()); // cipher.init(); }catch(NoSuchAlgorithmException e) { e.printStackTrace(); }catch(NoSuchPaddingException e) { e.printStackTrace(); } }
jvm参数设置:
-Xmx10m -Xms10m -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/Users/baitianxia/Documents/oom/heapdump.hprof
循环调用上面的方法就可以制造OOM了。
既然问题可以重现,下面就可以开始分析问题的原因了:
jvm参数设置的是当OOM的时候打印heap dump到指定目录。分析heap dump文件常用的工具是MAT(Memory Analyzer Tool)。
1)用MAT打开heapdump.hprof文件的截图如图1,看到占用内存最大的是饼图中的深蓝色部分,点击显示JceSecu