JVM 垃圾回收(Garbage Collection,GC)是 Java 内存管理的重要组成部分。它自动回收不再使用的对象,以避免内存泄漏和过度占用内存资源。以下是 JVM 垃圾回收机制的详细解析。
1. 垃圾回收的基本概念
- 垃圾对象:不再被任何引用变量引用的对象。
- 可达性分析算法:通过一系列称为 “GC Roots” 的对象作为起点,从这些节点开始向下搜索,搜索路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连(即不可达),则此对象被判定为垃圾对象。
2. JVM 内存区域和垃圾回收
JVM 的内存区域主要分为以下几部分:
- 新生代(Young Generation):包括 Eden 区、Survivor 0 区和 Survivor 1 区。
- 老年代(Old Generation):存放生命周期较长的对象。
- 永久代(Permanent Generation,JDK 7 之前)或元空间(Metaspace,JDK 8 及之后):存放类元信息、常量、静态变量等。
3. 垃圾回收算法
1. 标记-清除算法(Mark-Sweep)
- 标记阶段:标记所有需要回收的对象。
- 清除阶段:清除所有标记的对象。
优点:简单、易于实现。 缺点:标记和清除过程效率低,清除后会产生大量不连续的内存碎片。
2. 复制算法(Copying)
- 分为两部分:一部分用于分配新生对象,另一部分为空。
- 当一部分用满时:将存活对象复制到另一部分,然后清空已用满的部分。
优点:效率高、不会产生内存碎片。 缺点:需要双倍的内存空间。
3. 标记-整理算法(Mark-Compact)
- 标记阶段:标记所有需要回收的对象。
- 整理阶段:将所有存活的对象移动到内存的一端,按顺序排列,然后清理边界外的对象。
优点:解决了标记-清除算法的内存碎片问题。 缺点:对象移动过程效率低。
4. 分代收集算法(Generational Collecting)
结合上述几种算法,根据对象存活时间的不同将内存划分为不同的代(新生代、老年代),分别采用不同的垃圾回收算法。新生代通常采用复制算法,老年代采用标记-清除或标记-整理算法。
4. 常见的垃圾回收器
1. Serial GC
- 单线程垃圾收集器,适用于单核处理器和单线程应用。
- 新生代采用复制算法,老年代采用标记-整理算法。
2. Parallel GC(Parallel Scavenge)
- 多线程垃圾收集器,适用于多核处理器。
- 新生代采用复制算法,老年代采用标记-整理算法。
3. CMS GC(Concurrent Mark-Sweep)
- 主要面向老年代的垃圾收集器,目标是减少垃圾回收停顿时间。
- 标记-清除算法,分为初始标记、并发标记、重新标记和并发清除四个步骤。
4. G1 GC(Garbage-First)
- 面向服务端应用,适用于大内存多处理器。
- 将堆划分为多个大小相等的区域(Region),并行和并发地进行回收。
5. 垃圾回收过程中的停顿和优化
垃圾回收过程中,应用线程会暂停,这种现象称为 “STW(Stop-The-World)”。为了减少 STW 时间,可以进行以下优化:
- 调整垃圾回收器的参数(如堆大小、新生代与老年代的比例)。
- 使用更适合应用场景的垃圾回收器(如低延迟应用使用 CMS 或 G1)。
- 调优代码,减少对象的分配和内存的频繁使用。