JVM-深入解析垃圾回收算法

对象死亡判断

引用计数算法(Reference Counting)

在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的

引用计数算法虽然占用了一些额外的内存空间来进行计数,但是原理简单,判定高效;可是主流的java虚拟机中都没有引用计数算法来管理内存,这个算法有很多例外情况要考虑,必须配合大量额外的处理才能保证正确的工作,比如单纯的引用计数就很难解决循环引用问题

可达性分析算法(Reachability Analysis)

通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程走过的路径称为**“引用链(Reference Chain)”**,如果某个对象到GC Roots间没有任何引用链相连,或者说从GC Roots到这个对象不可达,则证明此对象是不可能再被使用的(根搜索算法)
在这里插入图片描述
可以作为GC Roots的对象有:

  1. 虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等
  2. 方法区中静态属性引用的对象,譬如java类的引用类型静态变量
  3. 方法区中常量引用的对象,譬如字符串常量池(String Table)里的引用
  4. 本地方法栈中JNI(Native 方法)引用的对象
  5. java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象,还有系统加载器
  6. 所有被同步锁(synchronized)持有的对象
  7. 反映java虚拟机内部情况的JMXBean、JVMT1中注册的回调、本地代码缓存等
引用

jdk1.2之前:如果reference类型的数据中存储的数值代表的另一块内存的起始地址,就称该reference数据是代表某块内存、某个对象的引用

jdk1.2之后,将引用分为:

  • 强引用(Strongly Reference):传统引用的定义,程序代码中普遍存在的引用赋值,类似Object a = new A();无论什么情况下,只要强引用关系还在,垃圾收集器就永远不会回收掉被引用的对象
  • 软引用(Soft Reference):用来描述一些还有用,但非必要的对象。只被软引用关联着的对象,在系统要发生内存溢出异常前,把这些对象列入回收范围,进行二次回收,若这次回收还没有足够的内存,才会抛出内存溢出异常;(用SoftReference类实现软引用)
  • 弱引用(Weak Reference):描述那些非必须对象,只能生存到下一次GC;GC开始时,无论如何都会回收掉这部分对象;(WeakReference来实现)
  • 虚引用(Phantom Reference):一个对象是否有虚引用存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例;为一个对象设置虚引用关联的唯一目的只是为了能让这个对象被收集器回收时收到一个系统通知(PhantomReference来实现)
回收方法区

方法区的GC主要回收废弃的常量和不再使用的类型;回收废弃常量和回收堆中的对象非常类似;

判定一个类型是否是不再使用的类型,需要同时满足三个条件

  1. 该类所有实例已经被回收,也就是堆中不存在该类和其任何派生子类的实例
  2. 加载该类的类加载器已经被回收(很难达成)
  3. 该类对应的java.lang.Class对象没用在任何地方被引用,无法在任何地方通过反射访问该类的方法

垃圾收集算法

分代收集理论
  • 弱分代假说:绝大多数的对象都是朝生夕灭的
  • 强分代假说:熬过越多次垃圾收集的对象就越难以消灭

这两个假说奠定了多种收集器的设计原则:收集器应该将堆划分为不同区域,将回收对象按照其年龄分配到不同区域存储

如果一个区域都是朝生夕灭的对象的话,那就把他们集中放在一起,就只用关注少量存活而不是去标记那些大量需要回收的对象;

如果剩下的都是难以消亡的对象,虚拟机就可以用较低的频率去回收这个区域,这样就同时兼顾了时间开销和内存有效利用

现在的商用虚拟机中一般分为新生代和老年代,新生代中每次回收会有大量的对象死去,存活的少数对象会逐步进入老年代

  • 跨代引用假说:跨代引用相对于同代引用来说数量极少

    存在互相引用关系的俩个对象应该是倾向于同时存活和同时死亡的,比如某个新生代对象存在跨代引用,但是老年代是很消亡的,那么新生代对象也会随之进入老年代中,跨代引用就消失了

  • 记忆集:根据跨代引用假说,不需要因为少量的跨代引用去扫描整个老年代,只需要在新生代上建立一个新的数据结构(记忆集Remembered Set),这个结构把老年代分为若干小块,标识出老年代哪些部分存在跨代引用,在minorGC的时候只需要把这些部分的对象加入GC Roots中进行扫描

标记-清除算法(Mark-Sweep)

先标记需要收集的对象,再统一收集;或者先标记存活的对象,再统一收集没标记的对象;

主要缺点:

  • 执行的效率不稳定,如果对象很多,就要标记和删除很多次
  • 内存碎片化,标记、清除之后会产生很多不连续的内存空间,如果要存放大对象的时候找不到这么一块连续的内存,又要触发一次GC
    在这里插入图片描述
标记-复制算法

为了解决标记删除算法回收大量对象效率低的问题,标记复制算法把内存空间分为了两部分,先是把一部分的存活对象复制到另一部分内存,然后再一次性清理原来使用过的这块内存;如果大多数对象是存活的,那就会浪费很多内存间复制的开销,但是如果大部分对象是可回收的,那复制的就是少部分的对象,而且也不需要考虑内存碎片的问题;缺点就是浪费了一半的内存空间
在这里插入图片描述
这种算法往往运用于新生代,由于新生代对象朝生夕灭的特定,大部分对象都逃不过第一轮收集,也就是说存活的对象很少,所以根本永不着拿一半的内存来用来复制对象;Appel式回收就对此优化了,它将内存划分为了一块Eden区和两块Survivor区,每次内存分配就使用一块Eden区和一块Survivor区,每次GC后,将所有存活的对象复制到另一个Survivor区,然后清理掉使用过的Eden区和Survivor区;

HotSpot虚拟机Eden区和Survivor区的大小比例是8:1,也就是说新生代可以用的内存空间是整个新生代空间的90%,但是并不能百分百保证10%的空间够放存活的对象(其实绝大部分情况是够了),但是Appel式回收还对这里做了一个处理,当MinorGC后Survivor区放不下存活的对象时,就需要依赖其他的内存(一般这里就是老年代,因为MinorGC存活下来的对象很可能会进入老年代)进行分配担保

标记-整理算法(Mark-Compact)

标记阶段和标记清除算法一样,然后再把存活的对象往一边移动,然后直接把边界外的对象全部清理掉
在这里插入图片描述
移动存活对象,在老年代这种每次GC都有大量对象存活的地方是一种极其负重的行为;这种操作必须暂停用户进程才可以,这种停顿叫做STW(Stop the World)

如果是标记清除算法,不去移动和整理内存,那碎片化问题就要用更复杂的内存分配器和内存访问器解决,内存的访问是用户程序最频繁的操作,这里出现额外的负担势必会影响吞吐量;

移动对象内存回收会更复杂一点,不移动对象内存分配会更复杂;移动对象吞吐量更高,不移动对象用户线程停顿的时间短,即使不移动对象收集器的效率会提升一些,但是内存分配和访问远远比垃圾收集的频率高,这部分耗时增加,总吞吐量是下降的;

还有一种做法是让虚拟机平时大部分情况用标记清除算法,暂时容忍内存碎片,直到内存碎片化的程度已经大到影响内存分配了,再采用标记整理算法收集一次;(CMS收集器面临空间碎片化过多就是使用的这种方法)

吞吐量

实质是赋值器(Mutator,可以理解为使用垃圾收集的用户程序/用户线程)与收集器的效率总和;
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

涛堆堆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值