在日常开发中,我们并不需要去关注垃圾回收,因为JVM动态内存分配和内存回收已经非常成熟了。但为了排查解决线上环境出现的内存泄漏和内存溢出问题,我们还是需要对JVM有一些深入的了解。
哪些内存需要回收?
在垃圾回收之前,我们需要先知道哪些垃圾需要被回收,在JVM中有两种判断“对象已死”的方法。
引用计数法(Reference Counting)
简单的描述就是:给一个对象添加一个引用计数器,每当有一个地方引用这个对象时,就给这个计数器加1;当删除对该对象的引用时,就将这个计数器减1。当计数器为0时,这个对象就被判定成为垃圾。但在对象循环引用时却不会被回收,如下代码:
public static class ReferenceCount {
public Object instance;
}
public static void main(String[] args) {
ReferenceCount a = new ReferenceCount();
ReferenceCount b = new ReferenceCount();
a.instance = b;
b.instance = a;
a = null;
b = null;
System.gc();
}
运行时添加**-XX:+PrintGCDetails**参数,从打印的GC信息可以看出,两个对象如果互相引用就不会被回收,控制台打印结果如下:
可达性分析法(Reference Counting)
该算法的基本思路就是通过一些被称为GC Roots的对象作为起点,从这些节点开始向下搜索,搜索走过的路径被称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时(即从GC Roots节点到该节点不可达),则证明该对象没有被引用。如图:
可作为GC Roots的对象主要包括:
- 虚拟机栈(栈帧中的本地变量表)引用的对象。此时obj为GC Root,当obj为null时,GC Root和obj的引用链断掉,obj将被回收。
public class Variable {
}
public void testGC() {
Variable obj = new Variable();
obj = null;
}
- 方法区中类静态属性引用的对象。obj为 GC Root,当obj 为 null时,会触发GC,GC Root 无法和obj所指向的 Variable对象 建立关系,会被回收。而 p 作为类的静态属性,也属于 GC Root,Prop对象依然与 GC root 建立着连接,所以此时 Prop对象并不会被回收。
public class Prop {
}
public static class Variable {
public static Prop p;
}
public void testGC() {
Variable obj = new Variable();
obj.p = new Prop();
obj = null;
}
- 方法区中常量引用的对象。p为常量,作为GC Root,即使obj置null,p仍然能和Prop建立联系,所以不会被回收。
public static class Prop {
}
public static class Variable {
public static final Prop p = new Prop();
}
public void testGC() {
Variable obj = new Variable();
obj = null;
}
- 本地方法栈(Native Method)引用的对象。
需要注意的是:即使一个对象未被引用,也并不一定会被回收。如果一个对象执行了finalize()方法,它仍然可以存活,而且finalize()只会执行一次。
垃圾收集算法
主要包括标记-清除算法(Mark-Sweep)、复制算法(Copying)、标记整理算法(Mark-Compact)、分代收集算法(Generational Collection)。
标记清除算法
分为标记和清除两个阶段,首先标记出所有需要回收的对象,标记完成之后统一对标记的对象进行回收。主要的缺点是:
- 效率问题,标记和清除两个过程的效率都不高。
- 空间问题,标记清除之后会产生大量的不连续的内存碎片,如果需要分配空间给大对象,就得提前触发另一次垃圾收集,腾出连续的内存空间。
复制算法
复制算法是为了解决效率问题而出现的,将可用内存分成大小相等的两块,每次只使用其中的一块,当这一块用完了,就将存活的对象复制到另一块上,再将使用过的内存空间一次清理。这样做的优点是不用考虑内存碎片的问题、实现简单、运行高效。但是每次只能使用原来内存的一半。
执行的示意图如下:
标记-整理算法
标记整理算法的标记过程和标记清除一致,但后续步骤不是直接清除可回收对象,而是让所有存活的对象都向一端移动,然后直接清理掉边界以外的内存,如下图:
分代收集算法
这种算法没有提出新的思想,只是根据对象的存活周期的不同将内存划分为几块。一般把java堆内存分为新生代和老年代,根据各个年代去选择合适的收集算法。比如:新生代垃圾收集的时候总是有大批对象被收集,只有少量对象存活,那就使用复制算法,只需要复制少量对象就可以完成垃圾收集。老年代对象存活率高就使用标记-清除或标记整理。
本文部分内容来自:
《深入理解Java虚拟机 JVM高级特性与最佳实践》 周志明 著