用 verbose GC 分析内存问题

最新推荐文章于 2021-08-23 17:17:18 发布

newhappy2008

最新推荐文章于 2021-08-23 17:17:18 发布

阅读量6.8k

点赞数 1

分类专栏： J2EE企业应用文章标签： allocation websphere application action jvm java

本文链接：https://blog.csdn.net/newhappy2008/article/details/7596027

版权

本文详细介绍了如何在 WebSphere Portal 6.0+版本中利用 verbose GC 输出来诊断和调优内存问题。通过分析 GC 的 mark、sweep 和 compact 阶段，以及不同类型的分配失败，确定了内存管理的关键指标。文中提到了如何启用 verbose GC，解析日志条目，并解释了如action=1等不同动作的含义。文章还探讨了GC的性能指标，如GC循环时间、空闲空间比例等，并提出了通过设置-Xk和-Xloratio参数来优化内存分配的建议。

摘要由CSDN通过智能技术生成

本文针对的是 WebSphere Portal 版本 6.0 或更高版本（和 5.1 或更高版本），其上运行的是 Java™ Software Development Kit (SDK) 1.4.2。为了获得最佳调优，建议使用 SDK 的最新服务发布，对于这里所讨论的调优，至少使用一个新于 SR13 的服务发布。

垃圾收集可简单定义为 JavaTM Virtual Machine (JVM) 释放不再被进程引用或使用的对象的 heap 的行为，heap 是指内存中的一个预先定义的部分，可用来管理 Java 应用程序内的资源。

这个过程有三个主要阶段：mark、sweep 和 compact：

在 mark 阶段，heap 内的所有对象均以一个 bit “标记”。然后检查这些对象看它们是否仍被引用，如果如此，这个 bit 即被删除。
在 sweep 阶段，JVM 遍历整个 heap 并删除仍具有标记 bit 的所有对象；这些对象不再被引用或使用。
compact 阶段只在一个完整的 GC 中才会运行，在这个阶段，GC 会试图将 heap 内的所有对象重新分配到 heap 内的一个更为紧缩、更为连续的较小空间。

监视 heap 使用情况的最好的方法是分析这个 verbose GC 的输出。

首先要确保该 verbose GC 在服务器上已被启用：

从 IBM WebSphere Application Server 管理控制台，导航到 Application Servers - WebSphere_Portal - Java and Process Management - Process Definition - Java Virtual Machine。
确保选中 Verbose garbage collection 旁的复选框，然后重启此服务器。
现在，应该可以看到类似于如下的条目被写入到 native_stderr.log 文件：
<AF[177]: Allocation Failure. need 528 bytes, 3602594 ms since last AF> <AF[177]: managing allocation failure, action=1 (0/585421800) (29966688/30811672)> <GC(177): GC cycle started Fri Sep 21 23:48:29 2007 <GC(177): freed 218620376 bytes, 40% free (248587064/616233472), in 459 ms> <GC(177): mark: 422 ms, sweep: 37 ms, compact: 0 ms> <GC(177): refs: soft 0 (age >= 32), weak 11, final 7424, phantom 0> <AF[177]: completed in 460 ms>

现在，让我们将之前的日志条目细分成几个部分并分别加以分析。

首先是：

<AF[177]: Allocation Failure. need 528 bytes, 3602594 ms since last AF>

通过这个条目，我们能够知道有一个分配失败，当 heap 内没有足够的连续空间可以分配给对象时，就会发生分配失败。对象是 verbose GC 输出中最为常见的。在本例中，它是一个 528 字节的小对象。

从此行可以看出，自我们上次运行了一个 GC 循环后已经过去了一段时间，3602594 ms。

接下来，我们研究最后一行：

<AF[177]: completed in 460 ms>

此行告诉我们在 GC 上花费的时间的数量。使用这个数字，我们就能够获得我们最近一次用在 GC 内的比率并找出我们花在 GC 和非实际工作上的时间比例；比如：

460/3602594 = .000127% of the time was spent in GC

在一个健康的服务器内，花在 GC 内的时间应该少于 13%，理想的是 7-10% 左右。

回到第二行：

<AF[177]: managing allocation failure, action=1 (0/585421800) (29966688/30811672)>