目录
jvm中基本的垃圾回收算法一共可以分为三种基础算法,针对后面所有的回收算法都是来源于这三种算法
标记-清除算法
直接标记对象,然后清除即可
缺点
- 效率低
- 内存会产生大量的内存碎片
比如你清除的对象有 A B C 他们的内存地址不是连续的 大小也不同, 这时候假定 A占用32字节 B 占用64字节 C 占用 16字节, 内存已经被占用完了,GC线程开始执行,当标记的对象被回收后,则会释放出 32 + 64 +16 = 112字节 这个时候,我new了一个对象,总共需要100字节的空间,则会出现内存溢出的问题,实际上GC腾出了112字节的空间,100字节的空间是完全有的,只是因为他们不是连续的,是碎片化,所以不能得到使用
复制算法
把空间分成两块,每次只对其中一块内存进行GC,存活下来的对象放到另一块内存上。
优点
1、解决了标记算法中内存碎片的问题
缺点
同样会造成内存利用率低的问题,因为大多数对象都熬不过第一次GC,所以没必要1:1划分空间,可以分一块比较大的Eden (伊甸区),分两块比较小的Survivor (生还者)空间,每次GC都对Eden空间和survivor其中的一块进行GC,GC后,将Eden空间和survivor空间存活的对象一次性复制到另一个survivor空间中,,最后清理Eden空间和survivor空间,大小比例一般是8:1:1,也就是说,每次浪费10%的空间,但是这里有一个问题,就是当存活对象大于10%的时候,就有问题。 可以将存不下的对象直接扔进老年代。
标记-整理算法(标记-压缩)
算法理论
标记-整理”(Mark-Compact)算法,在标记过程中,仍然与标记-清除算法一样,但是后续步骤不是对可回收对象直接进行处理,而是让所有存活的对象向一端移动,然后直接清理掉端边界以外的内存。
标记整理算法执行前的内存,灰色是被标记可以回收的内存
标记-整理算法后
优点
从上图可以看出,标记-整理算法后,内存编程了连续的,相比标记清除算法,避免了内存碎片的问题,想对于复制算法,避免了内存浪费的问题,可以更大的提高内存利用率
缺点
效率低,因为标记算法先要标记那些对象是存活的,然后让存活的对象向一端移动,然后在清除端边缘以外的内存。所以他效率肯定要低一些。
因为前面几种算法都有各自的优缺点,适用于不同的业务场景,所以为了达到更好的回收机制,就诞生了分代回收的这种算法机制
分代回收
根据存活对象划分几块内存区,一般是分为新生代和老年代。然后根据各个年代的特点制定相应的回收算法
新生代
每次GC都会有大量对象被回收,所以采用“复制算法”比较合理,有三个区,
- Eden(伊甸)
- Survivor1
- Survivor2
算法规则参照 “复制算法”
老年代
中的对象一般存活率比较高,回收掉的概率比较低一些,所以采用“标记-清除算法” 或者“标记-整理算法” 比较合理
垃圾回收器
HotSpot的10中垃圾回收器如图
图中虚线项链的都是可以配合使用的
Serial收集器
Serial 和 serial Old
Serial 是新生代的回收器,
serial Old 是老年代的回收器,他使用的算法是“标记-整理算法”
它是一个单线程的收集器,也就是说,它只会有一个线程去负责GC的处理。并且在垃圾回收时,必须暂停所有的工作线程。
ParNew收集器
个人理解他是serial多线程版
Parallel Scavenge 收集器
这是一个新生代的收集器,它用的算法是“复制算法”实现的,同时它是多线程进行的。
Parallel Old收集器
Parallel Old 是 Parallel Scavenge 收集器的老年代版本。多线程,使用 “标记-整理算法”
CMS收集器
CMS(并发标记清理收集器)收集器是一种以获取最短回收停留时间为目标的一种收集器,是基于“标记-清除算法”实现的
运作步骤:
- 初始标记(CMS initial mark):标记 GC Roots(根可达算法) 能直接关联到的对象
- 并发标记(CMS concurrent mark):工作线程和垃圾回收线程并发执行,程序一边执行,垃圾回收线程一边标记没用的对象,进行 GC Roots Tracing,
- 重新标记(CMS remark):修正并发标记期间的变动部分
- 使用“三色标记算法”找到漏标和误标
- 白色:未被标记的对象
- 灰色:自身被标记,成员变量未被标记
- 黑色:自身和成员变量均已标记完成
- 使用“三色标记算法”找到漏标和误标
- 并发清理(CMS concurrent sweep)
缺点
- 由于是并发执行,所以CMS在收集的时候会增加堆内存的占用,CMS必须要在老年代堆内存用尽之前完成回收,否则将会回收失败,则会触发担保机制,串行老年代收集器将会以STW的方式进行一次GC,从而造成工作线程很长时间的停顿。
- “标记-清除算法”无法整理内存空间,随着时间的推移,会出现大量的内存碎片,老年代空间也会随之被耗尽,最后不得不通过担保机制对堆内存进行压缩(使用Parallel Old(标记-整理算法))。CMS也提供了参数-XX:CMSFullGCsBeForeCompaction(默认0,即每次都进行内存整理)来指定多少次CMS收集之后,进行一次压缩的Full GC。
G1收集器
G1是一个逻辑分代,物理不分代的垃圾回收器;所有它将内存分成一个一个的块(Region),主要分为四个
- 老年代(old)
- 生还者(Survivor)
- 伊甸区(Eden)
- 大对象区(Humongous):当一个对象装不下的时候,会将几个区域连起来,称之为大对象区
优点:
- 分区域回收,不用一次回收整个内存。
- 每个区域的类型都是可以变更的,比如: 伊甸区(Eden)不够用了,可以将一部分老年代区(old)区变更为伊甸区(Eden)
STW
经常有人问STW,所以在这里特意解释一下STW这个词是什么,Java中Stop-The-World机制简称STW,是在执行垃圾回收时,会将所有的工作线程挂起,当清理完成后,在恢复工作线程
目前就整理了这么多, 后面再更新。