最近在看<<深入理解java虚拟机>>这本书,对垃圾收集算法这部分内容做个笔记整理下。
java的运行时数据区如下,其实就是堆,栈,方法区,其中栈又分为虚拟机栈,本地方法栈,程序计数器,并且栈是属于线程私有,堆跟方法区是线程共享的。
几乎所有的对象都是存放在堆中的,所以java堆是垃圾收集器管理的主要区域。
可达性分析算法
通过一些GC Roots作为起点,当一些对象没有任何引用链能够到达时,则证明该节点是不可用,是需要回收的,也就是通过GC Roots无法到达的对象就是可回收对象。
如何进行垃圾回收
找到了需要回收的对象之后,接下来就是要进行垃圾回收,那么垃圾收集有哪些算法呢
1.标记-清除算法
分为两步走,首先把内存中的对象进行标记,然后把可回收的单独拿走,这样的缺点是会产生大量的内存碎片,下次如果有有大对象创建的时候就会发现内存不够,又触发一次垃圾回收,但是实际上内存是够的,只是不能连续使用,因为我们申请内存空间的时候是需要连续的一片。
2.复制算法
将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后清除掉使用过的这一半。但是代价就是内存利用率太低。
3.标记-整理算法
标记过程仍然与标记 — 清除算法一样,然后让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域。
标记整理算法在标记-清除算法上做了升级,解决了内存碎片的问题,也规避了复制算法只能利用一半内存区域的弊端,但它对内存变动更频繁,需要整理所有存活对象的引用地址,在效率上比复制算法要差很多。
4.分代收集算法
分代收集算法,是融合上述3种基础的算法思想,而产生的针对不同情况所采用不同算法的一套组合。根据对象存活周期的不同将内存划分为几块。一般是把 Java 堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象是待回收的,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高,就使用标记-清除或标记-整理算法来进行回收。
java堆的划分
java堆分为2个区域,新生代和老年代,比例为1:2,而新生代又分为Eden区和Survivor区,Survivor 区又分为from区和to区,有些也称为s0,s1区,新生代的各区比例如下:8:1:1
对象在Eden区进行创建,当 Eden 区没有足够空间进行分配时,虚拟机会发起一次 Minor GC。通过 Minor GC 之后,Eden 会被清空,Eden 区中绝大部分对象会被回收,而那些无需回收的存活对象,将会进到 Survivor 的 From 区(若 From 区不够,则直接进入 Old 区)。然后到下一次 Minor GC的时候,又会把Eden区存活的对象和from区存活的对象复制到to区,然后清理掉Eden区跟from区,这样不断来回复制,经历15次 Minor GC 还能在新生代中存活的对象,才会被送到老年代。为什么是15次呢,因为对象头有一个地方是标记对象的年龄的,用2进制来表示,初始化是0000,一次之后就是0001,最后一次是1111,恰好可以标记15次。
老年代占据着2/3的堆内存空间,只有在 Major GC 的时候才会进行清理,每次 GC 都会触发“Stop-The-World”。内存越大,STW 的时间也越长,所以内存也不仅仅是越大就越好。由于老年代的对象存活较高,所以老年代使用标记 - 整理算法。