案例介绍: 一个带心跳检测功能的GUI桌面程序,每15秒发送一次心跳检测信号,如果对方30秒以内都没有信号返回,那就认为对方断开连接。程序上线后发现有误报的概率,查询日志发现误报的原因是程序会偶尔出现间隔约1分钟左右的时间完全无日志输出,处于停顿状态
因为是左面程序,内存不大(-Xmx256m),所以并没有想是GC导致的程序停顿,但是加入参数-XX:+PrintGCApplicationStoppedTime -XX:+PrintGCDateStamps -Xloggc: gclog.log后,从GC日志文件中确认了停顿时间是由GC导致的,大部分GC时间都控制在100毫秒以内,偶尔出现接近一分钟的GC,
寻找问题
添加参数-XX:+PrintReferenceGC参数,找到日志片段,从日志片段中看到真正执行GC的时间不是很长,但是从准备GC到真正开始GC所占的时间却占了绝大部分,
还观察到GUI程序内存变化的一个特点,当它最小化(浏览器右上角的减号)的时候,资源管理中显示的占用内存大幅度减少,但是虚拟内存没有变化,因此怀疑它的工作内存被自动交换到磁盘的页面文件中了,这样发生GC时就有可能因为恢复页面文件的操作(还原或者最大化)而导致不正常的GC停顿
解决问题
最后在MSDN上查证了这种猜想,因此Java的GUI程序中要避免这种现象,可以加入参数-Dsun.awt.keepWorkingSetOnMinimize=true
来解决。这个参数在许多AWT的程序上都有应用,例如JDK自导的Visual VM,用于保证程序在恢复最小化时能够立即响应