JVM学习02——垃圾收集器

判断对象是否存活

  • 引用计数法:在对象中加一个引用计数器,被引用一次计数器值+1,失效计数器-1,减为0对象死亡。容易出现两个对象互相引用导致无法回收的问题

  • 可达性分析:从一系列GC Roots的根对象为起始结点,从结点向下根据引用关系搜索。

    固定可作为GC Roots的对象包括:

    1. 虚拟机栈(帧栈的本地变量表)中引用的对象
    2. 方法区中类静态属性引用的对象
    3. 本地方法栈JNI引用的对象
    4. Class对象
class Person{
	
}
class Test{
	static Person a = new Person();	//方法区中类的静态属性引用的对象
	static final String s = "abc";	//方法区中常量引用的对象
	Person b = new Person();        //栈中本地方法表引用的对象
}

引用的类型

强引用: Object obj = new Object()类似 永远不会回收掉

**软引用:**非必须对象。在系统要发生内存溢出异常前,会对这些对象进行回收,如果还没有足够的内存,才会抛出内存溢出异常。 SoftReference类来实现软引用

**弱引用:**非必须对象。被弱引用对象只能生存到下一次垃圾收集发生为止。WeakReference类来实现弱引用。

**虚引用:**是最弱的一种引用关系,无法通过虚引用获取一个对象实例,唯一目的就是在这个对象被回收时收到一个系统通知。

方法区的回收

方法区主要存放永久代的对象,而永久性对象的回收率比新生代低很多,性价比不高。

方法区主要对常量池回收类的卸载

满足三个条件才对类进行卸载:

  • 类的所有实例已经被回收
  • 加载该类的类加载器已经被回收
  • 该类对应的java.lang.Class对象没有在任何地方被引用

finalize()方法(已不推荐使用):

一个对象被判断为死亡要至少经过两次标记:

第一次是在可达性分析后发现没有与GC Roots相连的引用链,这是第一次标记。随后对这些对象进行一些筛选,看是否有必要执行finalize方法。筛选的条件是:对象是否覆盖finalize()方法或者finalize()方法已被调用过一次。

需要执行finalize方法的对象被装入F-Queue队列中,在finalize方法中只要该对象重新与引用链上对象关联,就实现了自我拯救,在第二次标记时被移除队列。

垃圾收集算法

首先根据对象的存活周期不同,内存分为几部分:

标记清除(Mark-Sweep)算法

最基础的算法是标记清除算法,整个算法分为两个阶段:标记、清除。

首先标记所有需要回收对象,然后标记完成后,统一回收。

缺点是:

  • 执行效率不稳定:如果有大量对象要回收效率降低
  • 内存空间碎片化

标记复制算法

主要思想是将内存分为相等两块,当一块内存用完了,将还存活的对象复制到另一块上面,再把已使用过的内存空间一次清理掉。

由于新生代对象具有"朝生夕灭"的特点,虚拟机将内存空间分为一块较大的Eden空间和两块较小的Survivor空间,默认比例是8:1

每次垃圾收集只使用Eden和其中一块Survivor,将活着的对象复制到另一块Survivor上面。

PS:如果每次回收活着的对象超过10%怎么办?

答:有一个逃生门设计:当Survivor空间不足以容纳存活对象时,这些对象通过分配担保机制直接进入老年代

标记整理算法(老年代)

标记整理算法区别与标记复制算法,因为老年代存活的对象很多,复制算法不适合这种情况。

标记阶段和’标记-清除’算法一致,之后将所有活的对象都向内存一段移动(这种移动对象必须全程暂停用户程序,被称为“stop the world”)

缺点:

  • 移动对象内存回收效率变低

移动对象整个垃圾回收停顿时间⬆,延迟增加,但吞吐量⬆

不移动对象停顿时间⬇,延迟减小,但吞吐量⬇

几种垃圾收集器

Serial收集器

Serial (新生代)/ Serial Old (老年代):

  • 新生代收集器
  • 复制算法
  • 单线程,垃圾收集时暂停应用程序
  • 与Serial Old收集器组合
  • 一般运行在客户端,部分微服务领域没有过多线程交互

ParNew收集器

ParNew (新生代)/ CMS(老年代)

是Serial的多线程并行版本

  • 新生代收集器
  • 复制算法
  • 目前唯一与CMS收集器配合的
  • 运行在服务器端

Paraller Scavenge 收集器

是一款专注于吞吐量的新生代收集器

吞吐量:
吞 吐 量 = 运 行 用 户 代 码 时 间 运 行 用 户 代 码 时 间 + 垃 圾 收 集 时 间 吞吐量 = {运行用户代码时间 \over 运行用户代码时间+垃圾收集时间} =+
提供两个参数来精确控制吞吐量:

最大垃圾收集停顿时间 -XX:MaxGCPauseMillis、吞吐量大小 -XX:GCTimeTatio

最大垃圾收集停顿时间不是越小垃圾收集的就越快,它是以牺牲吞吐量和新生代空间。

Paraller Scavenge收集器还有一个开关参数 -XX:+UseAdaptiveSizePolicy,它可以自适应调节新生代大小、Eden与Survivor比例、老年代对象大小等


Serial Old收集器

  • Serial的老年代版本
  • 标记-整理算法
  • 运行在客户端

Parallel Old收集器

  • Parallel Scavenge 的老年代版本
  • 标记-整理算法
  • 与Parallel Scavenge配合,以’吞吐量优先’
  • 运行在服务器端,保证吞吐量

CMS收集器

CMS(Concurrent Mark Sweep)是以获取最短回收停顿时间为目标的收集器,与ParNew收集器配合。

它基于标记-清除算法,包含几个步骤:

  • 初始标记:仅仅只是标记一下 GC Roots 能直接关联到的对象,速度很快,需要停顿。

  • 并发标记:从GC Roots能关联到的对象开始遍历整个对象图

  • 重新标记:修正并发标记阶段用户程序运行导致标记变动的记录

  • 并发清除:清除掉标记阶段判定已死亡的对象

缺点:

  • 并发阶段,虽然不会导致用户线程停顿,但却占用一部分线程导致应用程序变慢,降低总吞吐量
  • 无法处理浮动垃圾(存在于并发阶段程序额外产生的垃圾),可能预留的内存不够存放浮动垃圾,导致并发失败进而导致Full GC的产生,这时虚拟机会临时启用Serial Old 代替CMS
  • 标记-清除算法导致的空间碎片,往往出现老年代空间剩余,但无法找到足够大连续空间来分配当前对象,不得不提前触发一次 Full GC。

G1收集器

G1收集器是垃圾收集器技术的里程碑式结果,在JDK9发布之时,G1宣告成为服务器端的默认垃圾收集器,目的是取代CMS收集器

G1设计的初衷是要一款能够建立可预测的停顿时间模型,意思是能支持指定在一个时间片内进行垃圾收集。

G1不再像其他垃圾收集器只收集新生代(Minor GC)或者只收集老年代(Major GC)或者整个堆全部收集(Full GC),而是采用Mixed GC模式,哪块内存中垃圾数量多,回收收益大就收集。

G1收集器是追踪各个Region里面垃圾堆积的’价值’大小,价值即回收所获得的空间大小以及回收所需时间的经验值,然后维护一个优先级列表,每次根据用户设定允许的收集停顿时间(通过-XX:MaxGCPauseMillis指定),优先处理回收价值最大的Region

分区 Region

G1采用了分区的思路,将整个堆空间分成若干个大小相等的内存区域,每个内存区域可以根据需要,扮演新生代Eden空间,Survivor空间或者老年代空间。并不要求对象的存储一定是物理上的连续,只要逻辑上连续即可

卡片 Card

在每个分区内部又被分成若干大小512 Byte卡片(Card),标识堆内存最小可用粒度所有分区的卡片会记录在 全局卡片表(Global Card Table)中,分配的对象会在物理上占用连续若干个卡片

Humongous区域

Humongous区域专门用来存储大对象(超过了一个Region容量一半的对象),如果超过了整个Region容量的超级大对象,会被存放在N个连续Humongous区域中,Humongous Region被当作老年代的一部分

已记忆集合 Remember Set

每个Region都维护一个自己的记忆集RSet,这些记忆集内部类似一个反向指针,记录别的Region指向自己的指针,并标记分别在哪些卡页范围内。

G1解决的3个问题

  • 对象跨Reigon(代)引用问题:

    假设进行一次只局限于新生代区域内的收集,但新生代中的对象很可能被老年代所引用,为了找出老年代中存活对象,必须还要额外遍历整个老年代中所有对象保证可达性结果的正确,增加很多内存负担。

    **解决方案:**每个Reigon区域维持记忆集,避免扫描所有区域

  • 并发标记阶段如何保证收集线程和用户线程互不干扰?

    并发标记阶段时用户线程会改变对象引用关系,但必须保证原本的对象图不能被打破,导致标记出错。

    **解决方案:**CMS采用增量更新算法实现,而G1收集器采用原始快照(SATB)算法实现。此外,G1为每一个Region设计两个名为TAMS(Top at Mark Start)的指针,把Region中的一部分空间划分出来用于并发回收过程中新对象的分配,并发回收时新分配对象地址要在两个指针位置以上

运行步骤

  • 初始标记:标记GC Roots能直接关联到的对象,并修改TAMS指针的值
  • 并发标记:扫描对象图,之后重新处理SATB记录下的有引用变动的对象
  • 最终标记:对用户线程短暂暂停,处理最后少量的SATB记录
  • 筛选回收:根据用户期望停顿时间来制定回收计划,将存活对象复制到空的Region中,再清理掉旧Region全部空间

几种概念解析

并发与并行

并行:描述的是多条垃圾收集器线程之间的关系。指同一时间有多条线程在协同工作

并发:描述的是垃圾收集器与用户线程之间的关系。指同一时间垃圾收集器线程与用户线程都在运行

原始快照算法

【最后欢迎大家来我的博客skiron.xyz来玩,一起学习进步!!!】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值