一.为什么要垃圾回收
Java语言中一个显著的特点就是引入了垃圾回收机制,使c++程序员最头疼的内存管理的问题迎刃而解。由于有个垃圾回收机制,Java中的对象不再有“作用域”的概念,只有对象的引用才有“作用域”。垃圾回收可以有效的防止内存泄漏,有效的使用空闲的内存。
二.对象存活算法引用计数法
1.对象是否存活判断
堆中每个对象实例都有一个引用计数。当一个对象被创建时,且将该对象实例分配给一个变量,该变量计数设置为1。当任何其他变量被赋值为这个对象的引用时,计数器加1(a=b,则b引用的对象实例的计数器+1),但当一个对象实例的某个引用超过了生命周期或者被设置为一个新值时,对象实例的引用计数器减1.任何引用计数器为0的对象实例可以被当作垃圾收集。当一个对象实例被垃圾收集时,它引用的任何对象实例的引用计数器减1.
优点:
引用计数收集器可以很快的执行,交织在程序运行中,对程序需要不被长时间打断的实时环境比较有利
缺点:
无法检测出循环依赖。从下面的代码可以轻易地发现myObject1与myObject2互为引用。我们知道如果采用引用计数法,myObject1和myObject2将不能被回收,因为他们的引用计数无法为零。
public class MyObject {
public Object ref =null;
public static void main(String[] args) {
MyObject myObject1 =new MyObject();
MyObject myObject2 =new MyObject();
myObject1.ref = myObject2;
myObject2.ref = myObject1;
myObject1 =null;
myObject2 =null;
}
}
但是具体是为什么呢?已下图为例,当代码执行完line7时,两个对象的引用计数均为2。此时将myObject1和myObject2分别置为null,以前一个对象为例,它的引用计数将减1。若要满足垃圾回收的条件,需要清除myObject2中的ref这个引用,而要清除掉这个引用的前提条件是myObject2引用的对象被回收,可是该对象的引用计数也为1,因为myObject1.ref指向了它。以此类推,也就进入一种死循环的状态。
三.可达性分析法(根搜索法)
hotspot虚拟机采用的是此回收算法
概念:
根搜索算法是从离散数学中的图论引入的,程序把所有的引用关系看作一张图,从一个节点GC ROOT开始,寻找对应的引用节点,找到这个节点以后,继续寻找这个节点的引用节点,当所有的引用节点寻找完毕之后,剩余的节点则被认为是没有被引用到的节点,即无用的节点
java中可以作为GC Root的对象有
1.虚拟机栈中引用的对象(本地变量表)
2.本地方法栈中引用的对象
3.方法区中静态属性引用的对象
4.方法区中常量引用的对象
四.标记清除算法
最基础的收集算法是“标记-清除”(Mark-Sweep)算法,如同它的名字一样,算法分为“标记”和“清除”两个阶段:
1.首先可以用我们上面的可达性分析法标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
2.它的主要不足有两个:
(1)一个是效率问题,标记和清除两个过程的效率都不高
(2)另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后再程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作
五.复制算法
1、为啥会有复制算法
为了解决标记清除算法的效率问题,一种称为“复制”(Copying)的收集算法出现了,它将可用内存按量划分为大小相等的两块,每次只使用其中的一块。
2、复制算法的原理
当一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效
3.jvm新生代内存划分
现在的商业虚拟机都采用这种收集算法来回收新生代,研究表明,新生代中的对象98%是“朝生夕死”的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。Eden、Survivor from和Survivor to内存比例为8:1:1。
4.jvm新生代内存回收过程
当回收时,将Eden和Survivor(from)中还存活着的对象一次性复制到另外一块Survivor(to)空间上,最后清理掉Eden和刚才用过的Survivor(from)空间,存活对象存放完成之后Survivor(to)的内容会复制到Survivor(from)。HotSpot虚拟机默认Eden和Survivor的大小比例为8:1,也就是每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的内存会被“浪费”。当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于10%的对象存活,当Survivor空间不够时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)。
六.标记整理算法
复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。最关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以老年代一般不能直接选用这种算法。根据老年代的特点,有人提出了另外一种“标记-整理(Mark-Compact)算法”,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
七.分代收集
一般把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法
在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集,而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法来进行回收。