深入理解jvm(二)jvm垃圾回收机制

离上一次发博客深入理解jvm(一)已经过去挺长时间,中间过了一个年,还经历了转正,还有同时兼顾两个项目,加上笔记一直放在语雀上,所以一直没有更新了,打算最近狂更两篇,把垃圾回收机制和垃圾回收器写清楚。


正文:

在这一章节里 垃圾回收机制主要是围绕三个问题问题展开:哪些内存需要回收? 什么时候回收? 如何回收?先来看看哪些内存需要回收这个问题。

哪些内存需要回收

先说答案:死去的对象所占的内存空间需要回收

那么如何判断对象是否死去呢?有两种方法:

  1. 引用计数算法: 为对象添加一个引用计数器,每当对象在一个地方被引用,则该计数器加1;每当对象引用失效时,计数器减1。但计数器为0的时候,就表示该对象没有被引用。

引用计数法原理简单,判定效率也高,但基本不被现在主流的垃圾回收器所采用,因为单纯的引用计数法解决不了对象之间相互循环引用的问题,这会使得对象的引用永不为0,所以该算法在本次学习中了解即可。

  1. 可达性分析: 从根节点开始(也就是我们说的GCRoot根),根据引用关系向下搜索,搜索过程走过的路径叫做引用链,凡是在引用链上的对象都不会被回收。

在上图中,左边的Obj123就属于在引用链上的对象,ab则不是,所以当此时发生gc的时候左边的对象就不会被回收,右边的则会被回收掉。

GC Roots包括以下这些对象:

1、虚拟机栈(栈帧中的本地变量表)中引用的对象。(主要记住这个)

2、方法区中类静态属性引用的对象。

3、方法区中常量引用的对象。

4、本地方法栈中JNI(Native方法)引用的对象。

5、Java虚拟机内部的引用,基本数据类型对应的Class对象,一些常驻的异常对象。

6、被同步锁(synchronized)持有的对象。

引用关系

这里的引用关系就是刚刚可达性分析简介标红的关键词。

强引用(Strong Reference):普通对象创建时默认是强引用关系,只要强引用还存在,垃圾收集器就不会收集这些对象。

Object obj = new Object(); //强引用对象
//假设在第一行的时候obj是一个GCRoot,当obj==null或者弹栈的时候,这个引用就等于被销毁了,
//gcroot链也就断了,随之原来obj堆里指向的对象也就变成了垃圾对象。
//修正理解:弹栈的时候引用并没有被销毁,只是obj不在是GCRoot了,所以这一整个链上的对象都会被回收

软引用(Soft Reference):用来描述一些还有用但非必需的对象,如果一个对象还存在着软引用关联,则虚拟机在发生OOM异常前,会将这些软引用对象进行二次回收。实现软引用的方式:SoftReference类。

弱引用(Weak Reference):也是用来描述非必需对象,但强度较软引用更弱,在下一次GC时就会被回收。实现弱引用方式:WeakReference类。

虚引用(Phantom Reference):虚引用也称幽灵引用或者幻影引用,是最弱的一种引用关系,一个对象是否是虚引用不会对其生存时间造成印象,也无法通过虚引用来获取对象实例。设置虚引用的唯一目的就是在该对象被GC时能够收到一个系统通知。

如何回收?

刚刚说了哪些对象要回收,接下来说一下如何回收,或者说回收的方式有什么,也是先说答案:

  1. 标记清除算法

  1. 标记复制算法

  1. 标记整理算法

通过以上3种算法即可实现垃圾回收,在说这三种垃圾回收算法之前需要先了解一下分代收集理论。

分代收集理论

分代收集理论建立在3个假说之上:

  1. 弱分代假说:绝大多数对象都是朝生夕灭的,就是说绝大多数对象都是存活时间很短,发生一次gc会回收大量对象;

  1. 强分代假说:熬过越多次垃圾收集过程的对象就越难以消灭,说的就是对象从eden区到survivor区再到老年代的一个过程,默认参数是经历过15次gc对象就会被放入老年代。

  1. 跨代引用假说:跨代引用是占极少数的。

上面说的分代收集,可以笼统的把堆内存视为上图所示。

对象在创建的时候会先分配到eden区,根据弱分代假说:绝大多数对象都是朝生夕灭的,所以在发生一次gc以后,eden区的大量对象都将消亡,剩下活下来的对象就会被放到survivor区;根据强分代假说:熬过越多次垃圾收集过程的对象就越难以消灭,所以存活下来的对象会逐步进入老年代(关于survivor区,存活下来的对象可能会放在s0,第二次存活放s1,第三次又s0,直到15次到老年代,当然老年代后面也还有内存区域)。这就是对象在堆中的存储位置的变化过程。但这种方法也存在一定缺陷,就是会产生跨代引用,什么是跨代引用,就比如说老年代的对象引用了新生代的对象,新生代在发生gc的时候就不得不一起扫描老年代,但是这样成本会比较大,这个时候新生代引入了一个记忆集的概念来解决相关问题。

有了分代理论就再提一下gc的分类:

  • Minor GC/Young GC:针对新生代的垃圾收集。

  • Major GC/Old GC:针对老年代的垃圾收集。

  • Mixed GC:整个新生代和部分老年代,G1收集器采用。

  • Full GC:针对整个Java堆以及方法区的垃圾收集,Full GC发生就是STW。

留个问题:为什么老年代会引用新生代?

答:比如说有一个全局的List对象,这个对象就肯定是会放到老年代的,当你new了一个对象往里放的时候就产生了老年代引用新生代的情况。

接下啦就是如何回收的重点,三个垃圾回收算法:

标记清除算法

该算法分为“标 记”和“清除”两个阶段:首先标记出所有需要回 收的对象,在标记完成后统一回收所有被标记的对 象,这里的标记就是前面说的找引用链的过程。

上图可以看到,在进行垃圾回收之后,堆空间有大量的碎片,出现了不规整的情况。在给大对象分配内存的时候,由于无法找到足够的连续的内存空间,就不得不再一次触发垃圾收集。另外,如果Java堆中存在大量的垃圾对象,那么垃圾回收的就必然进行大量的标记和清除动作,这个势必造成回收效率的降低。

注意:该算法产生的空间碎片并不是不可用的,虚拟机是可以通过采用“分区空闲分配链表”来解决内存分配的问题的,但是由于内存的访问频繁,这就势必要使得花费一定的开销在维护分配链表。

标记复制算法

标记复制算法将可用内 存按容量划分为大小相等的两块,每次只使用其中 的一块。当这一块的内存用完了,就将还存活着的 对象复制到另外一块上面,然后再把已使用过的内 存空间一次清理掉。这样使得每次都是对整个半区 进行内存回收,内存分配时也就不用考虑内存碎片 等复杂情况,只要移动堆顶指针,按顺序分配内存 即可,实现简单,运行高效。只是这种算法的代价 是将内存缩小为了原来的一半

如上图所示,初次被创建的对象会存放在新生代的Eden区,当第一次触发Minor GC,Eden区存活的对象被转移到Survivor区的某一块区域。以后再次触发Minor GC的时候,Eden区的对象连同一块Survivor区的对象一起,被转移到了另一块Survivor区。每经历过一次垃圾回收的对象,它的分代年龄就加1,当分代年龄达到15以后,就直接被存放到老年代中,大对象也会直接进入老年代。

标记整理算法

复制收集算法在对象存活率较高时就要进行较 多的复制操作,特别是在对老年代进行收集的时候,效率将会变低,所以这个时候需要一种标记整理算法,标记过程仍 然与“标记-清除”算法一样,但后续步骤不是直 接对可回收对象进行清理,而是让所有存活的对象 都向一端移动,然后直接清理掉端边界以外的内 存。

标记整理解决了内存的高可利用性,但也是存在风险的,在进行存活对象整理的时候是要暂停所有用户线程的(STW),这就会产生一定的卡顿。

一种比较好的解决方案:可以让虚拟机在平时多数时间采用标记清除算法,暂时允许内存碎片的存在,直到内存空间的碎片化程度影响对象的分配时,在采用标记整理算法整理内存空间,CMS收集器采用该种算法。

何时回收?

何时回收呢,通过上面的分代理论和垃圾回收算法,我们现在可以大概知道当该分代无法在分配内存的时候我们就应该gc了,就比如说垃圾桶满了就该倒垃圾了,当然具体的垃圾回收时间可以由具体的垃圾回收器设置参数决定。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值