1、问题
开放平台2.0 GC(ParNew+CMS)会出现频率飙升
2、分析
怀疑接口请求量增加,导致内存占用比较多,造成年轻代频繁进行young gc,但是查看开放平台的请求并没有发现流量的突增。所以并没有什么有效的结论。
3、解决
尝试替换成G1垃圾收集器替换掉(ParNew+CMS),对应gc的参数如下:
-Xms4g
-Xmx4g
-Xss512k
-XX:MetaspaceSize=256m
-XX:MaxMetaspaceSize=512m
-XX:MaxDirectMemorySize=1536m
-XX:NativeMemoryTracking=detail
-XX:+ParallelRefProcEnabled
-XX:ParallelGCThreads=4
-XX:ConcGCThreads=4
-XX:+UseG1GC
-XX:G1HeapRegionSize=2M
-XX:InitiatingHeapOccupancyPercent=40
-XX:MaxGCPauseMillis=80
调整之后gc的监控信息如下
再次调整参数
-Xms6g
-Xmx6g
-XX:G1HeapRegionSize=4M
调整之后效果如下:
G1最重要的概念就是Region,采用分而治之,部分收集的思想,尽量减短STW的时间
CMS的gc日志如下,虽然出现的频率比较低但是会产生比较长的停顿,这种停顿在高并发场景下是不能忍受的,替换成G1之后可以减少或者避免这种情况的出现。
4、总结
这是一次经历十分神奇的调优过程,虽然到最后我们也没能验证到底是什么原因导致的问题,但最终还是通过弯道的方式解决了问题。也进一步体现了技术发展的优越性。本次调优经历带给我的感受就是:一切从实际问题出发,以解决问题为目的。虽然大部分时候遇到问题都需要先找出原因再对症下药进行修复,但是找出原因只是手段,并不是目的。目的是最终要解决问题,保障生产的稳定性。