深入理解Java虚拟机读书笔记(6): 深入理解垃圾回收算法
下面就几种最常见的垃圾回收算法进行简单介绍。
一、标记-清除算法
“标记-清除”(Mark-Sweep)算法是最基础的收集算法,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有
被标记的对象。
不足:
-
一个是
效率问题
,标记和清除两个过程的效率都不高 -
另一个是空间问题,标记清除之后会产生大量不连续的
内存碎片
,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作
二、复制算法
为了解决效率问题,出现了“复制”(Copying)收集算法。它将可用内存按容量划分为大小相等的两块
,每次只使用其中的一块。 当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
对于这种实现,使得每次都是对整个半区进行内存回收
,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。
不足:
将内存缩小为了原来的一半 ,代价太高。
但是,现在的商业虚拟机都采用这种收集算法来回收新生代
。 IBM公司的专门研究表明,新生代中的对象98%是“朝生夕死”
的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间
和两块较小的Survivor空间
每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
HotSpot虚拟机默认Eden和Survivor的大小比例是8:1
,也就是每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的内存会被“浪费”。这是复制算法的一种改进,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于10%的对象存活,当Survivor空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)
。
所谓分配担保,就是如果另外一块Survivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象将直接通过分配担保机制进入老年代
。
至于为什么新生代内存需要有两个Survivor区问题,可以参考这篇博客(博客链接)
三、标记-整理算法
复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。
“标记-整理”(Mark-Compact)算法是“标记-清除”算法的改进,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存
。
四、分代收集算法
当前商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法,所谓分代收集,其实就是根据对象存活周期的不同将内存划分为不同的几块。一般是把Java堆分为新生代
和老年代
,这样就可以根据各个年代的特点采用最适当的收集算法。
在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法
,只需要付出少量存活对象的复制成本就可以完成收集。 而老年代中因为对象存活率高、 没有额外空间对它进行分配担保,就必须使用“标记—清理”
或者“标记—整理”
算法来进行回收。