垃圾回收算法
垃圾回收算法(GC,Garbage Collection)
GC的作用区域
GC垃圾回收,主要在伊甸园区和养老区
JVM在进行GC时,并不是对这三个区域统一回收,大部分时候,回收都是新生代
- 新生代
- 幸存区(form to)【会交换的,不是一成不变的】
- 老年区
GC两种类型:轻GC(普通的GC),重GC(全局GC)
GC面试题
**Q1:**JVM的内存模型和分区~每个区放什么?
Q2:堆里面的分区有哪些?Eden,from,to,老年区,说说他们的特点!
Q3:GC的算法有哪些?标记清除法,标记压缩,复制算法,引用计数器,怎么用?
Q4:轻GC和重GC分别发生在什么时候?
GC算法
红色是标记的非活动对象,绿色是活动对象。
引用计数器法
哪个对象的引用数为0,就会回收哪个对象
标记-清除(Mark-Sweep)
GC分为两个阶段,标记和清除。首先标记所有可回收的对象,在标记完成后统一回收所有被标记的对象。同时会产生不连续的内存碎片。碎片过多会导致以后程序运行时需要分配较大对象时,无法找到足够的连续内存,而不得已再次触发GC。
- 缺点:两次扫描,严重浪费时间,会产生内存碎片
- 优点:不需要额外的空间
复制(Copy)
将内存按容量划分为两块,每次只使用其中一块。当这一块内存用完了,就将存活的对象复制到另一块上,然后再把已使用的内存空间一次清理掉。这样使得每次都是对半个内存区回收,也不用考虑内存碎片问题,简单高效。缺点需要两倍的内存空间。
一般新生代(伊甸园区、幸存区)会使用复制算法,生成新的to区
- 好处:没有内存的碎片
- 坏处:浪费了内存空间,多了一半空间永远是空to
复制算法最佳使用场景:对象存活度较低的时候,也就是新生区
标记-整理(Mark-Compact)
也分为两个阶段,首先标记可回收的对象,再将存活的对象都向一端移动,然后清理掉边界以外的内存。此方法避免标记-清除算法的碎片问题,同时也避免了复制算法的空间问题。
一般年轻代中执行GC后,会有少量的对象存活,就会选用复制算法,只要付出少量的存活对象复制成本就可以完成收集。而老年代中因为对象存活率高,没有额外过多内存空间分配,就需要使用标记-清理或者标记-整理算法来进行回收。
但是又多了一个移动成本
标记清除压缩
先标记清除一次,然后再压缩
总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法
思考:难道没有最优算法吗?
答案:没有,没有最好的算法,只有最合适的——>GC:分代收集算法
垃圾收集器
-
串行收集器(Serial)
比较老的收集器,单线程。收集时,必须暂停应用的工作线程,直到收集结束。 -
并行收集器(Parallel)
多条垃圾收集线程并行工作,在多核CPU下效率更高,应用线程仍然处于等待状态。 -
CMS收集器(Concurrent Mark Sweep)
CMS收集器是缩短暂停应用时间为目标而设计的,是基于标记-清除算法实现,整个过程分为4个步骤,包括:
- 初始标记(Initial Mark)
- 并发标记(Concurrent Mark)
- 重新标记(Remark)
- 并发清除(Concurrent Sweep)
其中,初始标记、重新标记这两个步骤仍然需要暂停应用线程。初始标记只是标记一下GC Roots能直接关联到的对象,速度很快,并发标记阶段是标记可回收对象,而重新标记阶段则是为了修正并发标记期间因用户程序继续运作导致标记产生变动的那一部分对象的标记记录,这个阶段暂停时间比初始标记阶段稍长一点,但远比并发标记时间段。
由于整个过程中消耗最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作,所以,CMS收集器内存回收与用户一起并发执行的,大大减少了暂停时间。
-
G1收集器(Garbage First)
G1收集器将堆内存划分多个大小相等的独立区域(Region),并且能预测暂停时间,能预测原因它能避免对整个堆进行全区收集。G1跟踪各个Region里的垃圾堆积价值大小(所获得空间大小以及回收所需时间),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region,从而保证了再有限时间内获得更高的收集效率。
G1收集器工作工程分为4个步骤,包括:
- 初始标记(Initial Mark)
- 并发标记(Concurrent Mark)
- 最终标记(Final Mark)
- 筛选回收(Live Data Counting and Evacuation)
初始标记与CMS一样,标记一下GC Roots能直接关联到的对象。并发标记从GC Root开始标记存活对象,这个阶段耗时比较长,但也可以与应用线程并发执行。而最终标记也是为了修正在并发标记期间因用户程序继续运作而导致标记产生变化的那一部分标记记录。最后在筛选回收阶段对各个Region回收价值和成本进行排序,根据用户所期望的GC暂停时间来执行回收。