什么是垃圾回收?
垃圾回收(Garbage Collection,GC),顾名思义就是释放垃圾占用的空间,防止内存泄露。有效的使用可以使用的内存,对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收。
垃圾回收的常见算法:
引用计数法、标记清除法、标记压缩法、复制算法、分代算法
引用计数法:
给每个对象设置一个计数器,当有地方引用该对象时计数器+1,引用失效时计数器-1。用计数器是否为0来判断该对象是否可被回收。
优点:
-
实时性较高,不用等到内存不够时才开始进行垃圾回收,运行时可以根据计数器是否为0来回收。
-
在垃圾回收的过程中,应用无需挂起,如果申请内存时内存不足直接报outofmember错误。
-
区域性,更新对象的计数器时,只是影响到该对象,不会扫描全部对象。
缺点:
-
每次对象被引用时,都需要更新计数器有时间开销
-
浪费CPU资源,即使内存够用,仍然在运行时进行计数器的统计
-
无法解决循环引用的问题(最大的缺点)
我们来看下面这个例子:
public class ReferenceCountingGC {
public Object instance;
public ReferenceCountingGC(String name) {
}
public static void testGC(){
ReferenceCountingGC a = new ReferenceCountingGC("objA");
ReferenceCountingGC b = new ReferenceCountingGC("objB");
a.instance = b;
b.instance = a;
a = null;
b = null;
}
}
最后这两个对象都不能被访问了,但是由于他们相互引用导致计数器不为0,通过引用计数法永远无法通知GC收集器回收。
标记清除法
两个阶段:标记、清除
标记清除算法(Mark-Sweep)是最基础的一种垃圾回收算法,它分为两个阶段。先把内存中的对象进行标记,哪些属于可回收的标记出来,然后把这些垃圾清理掉,如上图所示。清理掉的内存空间就会变为未使用的内存区域。但是问题也很显而易见,存在内存碎片。
优点:
-
解决了引用计算算法中的循环引用的问题,没有从root节点引用的对象都会被回收
缺点:
-
效率较低,标记和清除两个动作都要遍历所有的对象,并且在GC是,需要停止应用程序,对与交互性要求比较高的应用而言这个体验是非常差的。
-
碎片化严重
标记压缩算法
标记压缩算法是在标记清除算法的基础之上做了优化的算法。和标记清除算法一样,从根节点开始对对象的引用进行标记,然后将存活的对象压缩到内存的一端,然后清理边界以外的垃圾,从而解决了碎片化的问题。但是标记整理算法对内存变动更频繁,需要整理所有存活对象的引用地址,在效率上比复制算法要差很多。
复制算法
复制算法的核心就是,将内存空间化为等分的两块,每次只使用一块,垃圾回收时将正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾回收。
这样使得每次都是对其中的一块进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。
缺点:
-
效率问题: 在对象存活率较高时,复制操作次数多,效率降低
-
空间问题:內存缩小了一半;需要額外空间做分配担保(老年代)
jvm中年轻代的内存空间使用的就是复制算法
分代算法
前面介绍的每一种算法都有自己的优缺点,谁都不能替代谁,所以根据垃圾回收对象的特点进行选择才是明智的选择。
分代算法中,把Java堆分为新生代和老年代,年轻代使用复制算法,老年代适合使用标记清除算法或者标记压缩算法。