1.概述
垃圾回收,顾名思义就是释放垃圾占用的内存,防止内存的泄露。有效的使用可以使用的内存,对内存堆中已经死亡或者长时间没有使用的对象进行清除和回收。
2.垃圾判断算法
2.1引用计数器法
给每个对象添加一个计数器,当有地方引用改对象时,计数器加1,当引用失效时,计数器减1。用引用对象的计数器是否为0来判断对象是否可以被回收。此方法的缺点是无法解决循环引用的问题。
引用计数器的算法是将垃圾回收应用到整个程序的运行当中,而不是在进行垃圾收集时,要挂起整个应用的运行,直到对堆中所有的对象都处理结束。因此,引用计数器算法并不是严格意义的stop-the-world 的垃圾收集机制。
(Stop-The-World机制:简称STW,即在执行垃圾回收算法的时候,Java应用的程序的其他所有除了垃圾收集收集器线程之外的线程都被挂起。此时,系统只能允许GC线程进行运行,其他线程会全部暂停 ,等待GC线程全部执行完毕才能再次运行。)
看下面一段代码:
public class ReferenceCountingGC {
public Object instance;
public ReferenceCountingGC(String name) {
}
public static void testGC(){
ReferenceCountingGC a = new ReferenceCountingGC("objA");
ReferenceCountingGC b = new ReferenceCountingGC("objB");
a.instance = b;
b.instance = a;
a = null;
b = null;
}
}
我们可以看到,最后两个对象已经不可能再被访问了,但由于互相引用着对方,导致他们的计数器永远也不会为0,通过引用计数算法,也就永远也无法 通知GC收集器收集它们。
2.2可达性分析算法
通过GC ROOT的对象作为起点,通过引用向下搜索,所有走过的路径称为引用链。通过对象是否到达引用链的路径来判断是否可以被回收。(可以作为GC ROOT的对象:虚拟机栈中引用的对象,方法区中类静态属性引用的对象,方法区中常量引用的对象,本地方法栈中JNI引用的对象)
通过可达性算法,成功解决了引用计数器无法解决的循环依赖的问题,只要无法与GC ROOT建立直接或者间接的连接,系统就会判断你为可回收的对象。这样,就引申出了一个问题,哪些可以作为GC ROOT。
虚拟机栈中引用的对象
public class MethodAreaStaicProperties {
public static MethodAreaStaicProperties m;
public MethodAreaStaicProperties(String name) {}
public static void testGC(){
MethodAreaStaicProperties s = new MethodAreaStaicProperties("properties");
s.m = new MethodAreaStaicProperties("parameter");
s = null;
}
}
此时的s,即为GC Root,当s置空时,localParameter对象也断掉了与GC Root的引用链,将被回收。
方法区中静态属性引用的对象
public class MethodAreaStaicProperties {
public static MethodAreaStaicProperties m;
public MethodAreaStaicProperties(String name) {}
public static void testGC(){
MethodAreaStaicProperties s = new MethodAreaStaicProperties("properties");
s.m = new MethodAreaStaicProperties("parameter");
s = null;
}
}
此时的s,即为GC Root,s置为null,经过GC后,s所指向的properties对象由于无法与GC Root建立关系被回收。而m作为类的静态属性,也属于GC Root,parameter 对象依然与GC root建立着连接,所以此时parameter对象并不会被回收。
方法区中常量引用的对象
public class MethodAreaStaicProperties {
public static final MethodAreaStaicProperties m = MethodAreaStaicProperties("final");
public MethodAreaStaicProperties(String name) {}
public static void testGC() {
MethodAreaStaicProperties s = new MethodAreaStaicProperties("staticProperties");
s = null;
}
}
m即为方法区中的常量引用,也为GC Root,s置为null后,final对象也不会因没有与GC Root建立联系而被回收。
本地方法栈中引用的对象
3.垃圾回收算法
在确定了哪些垃圾可以被回收后,垃圾收集器要做的事情就是开始进行垃圾回收,但是这里面涉及到一个问题是:如何高效地进行垃圾回收。这里我们讨论几种常见的垃圾收集算法的核心思想。
3.1标记清除法
标记清除算法(Mark-Sweep)是最基础的一种垃圾回收算法,它分为2部分,先把内存区域中的这些对象进行标记,哪些属于可回收标记出来,然后把这些垃圾拎出来清理掉。就像上图一样,清理掉的垃圾就变成未使用的内存区域,等待被再次使用。但它存在一个很大的问题,那就是内存碎片。
3.2复制算法
复制算法(Copying)是在标记清除算法基础上演化而来,解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用,内存分配时也就不用考虑内存碎片等复杂情况。复制算法暴露了另一个问题,例如硬盘本来有500G,但却只能用200G,代价实在太高。
3.3标记-整理算法
标记-整理算法标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域。
标记整理算法解决了内存碎片的问题,也规避了复制算法只能利用一半内存区域的弊端。标记整理算法对内存变动更频繁,需要整理所有存活对象的引用地址,在效率上比复制算法要差很多。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
3.4分代收集算法
分代收集算法分代收集算法严格来说并不是一种思想或理论,而是融合上述3种基础的算法思想,而产生的针对不同情况所采用不同算法的一套组合拳,根据对象存活周期的不同将内存划分为几块。
在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。
在老年代中,因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记-清理算法或者标记-整理算法来进行回收。