JVM 垃圾回收机制

垃圾回收(Garbage Collect,简称GC)是编程语言中提供的内存管理功能。

在一些不具备GC的语言如 C++中,手动创建对象后需要在不使用该对象上手动释放它的内存空间,防止内存泄漏。另外一些语言如 Java、Python 等则无需手动管理内存,内置了垃圾回收机制,使开发人员从内存管理上解脱出来。

在垃圾回收之前,首先要要找出死亡的对象,或者说仍旧存活的对象,存活对象的判定主要有如下两种算法:

  • 引用计数算法(Reference Counting)
  • 可达性分析算法(tracing GC)

引用计数算法

首先要说明的是,现在主流的 JVM 无一使用引用计数方式实现Java对象的自动内存管理,但 Python 还在使用引用计数。

引用计数算法是比较古老的算法。该算法的主要思想是每个对象附加有一个计数器,每有一个引用,计数器值加1;每失去一个引用,计数器值减1。垃圾回收时,只需寻找计数器值为0所对应的对象并回收。但引用计数算法最主要的缺陷是无法处理循环引用的问题,如下所示:

对象1和对象2互相引用,除此之外,不再与其它任何对象有联系,此时这两个对象理应被垃圾回收期回收,但它们的计数器值都为1,被判定为存活的对象(更高级的引用计数实现会引入“弱引用”的概念来打破某些已知的循环引用)。


可达性分析算法

目前 JVM 基本都是采用可达性算法。算法的基本思想是:通过一系列的称为 GC Roots 的对象作为起点开始搜索,可达对象被认定为存活对象,不可达对象则是需要回收的内存,如下图所示:

对象 Object4 与 Object5 虽然存在互相引用,但是它们到 GC Roots 是不可达的,所以将会被判定为是可回收的对象。

在 Java 中,可作为 GC Roots 的对象包括以下几种:

  • 虚拟机栈(栈帧中的局部变量表)中引用的对象
  • 方法区中的静态变量与常量引用的对象
  • 本地方法栈中JNI(Native方法)引用的对象

垃圾回收算法

Java 中的垃圾回收算法主要分为以下几类:

  • 标记清除(Mark-Sweep)算法
  • 复制(Copying)算法
  • 标记整理(Mark-Compact)算法

当前商业虚拟机的常用的垃圾收集算法属于分代收集算法,此算法的主要思想为:根据对象存活周期的不同将内存划分为几块,一般是把 Java 堆分为新生代和老年代,根据各个年代的特点采用最适合的收集算法:

  • 新生代:对象死亡率高,适合选用复制算法
  • 老年代:对象存活率高、没有额外空间对它进行分配担保,适合使用“标记-清除”或“标记-整理”算法来进行回收。

标记清除算法

标记-清除算法将垃圾回收分为两个阶段:

  1. 标记阶段:根据可达性分析算法标记所有从根节点开始的对象,未被标记的对象就是未被引用的垃圾对象
  2. 清除阶段:清除所有未被标记的对象

标记清除算法带来的一个问题是会存在大量的空间碎片,因为回收后的空间是不连续的,如下图所示:

标记清除的缺点是会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不触发另一次垃圾收集动作。


复制算法

复制算法将内存划分为两个区间,所有动态分配的对象都只能分配在其中一个区间,而另外一个区间处于空闲状态。

当有效内存空间耗尽时,JVM 将暂停程序运行,开始GC。GC线程会将活动区间内的存活对象全部复制到空闲区间,按照内存地址依次排列,并将存活对象的内存引用地址指向新的内存地址。

复制算法不会产生垃圾碎片,不过它的缺点也是相当明显的:

  • 浪费了一半的内存空间
  • 对象存活率越高,复制与更新引用地址的工作量越高

现在的商业虚拟机都使用复制算法来回收新生代。新生代的GC又叫 Minor GC ,关于这方面的内容,可以查看另一篇文章:Java 新生代与老年代

复制算法的高效性是建立在存活对象少、垃圾对象多的前提下的。这种情况在新生代经常发生,但是在老年代更常见的情况是大部分对象都是存活对象。如果依然使用复制算法,由于存活的对象较多,复制的成本也将很高。

此外,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用复制算法。


标记整理算法

标记整理算法的主要思想为:标记过程与 标记-清除 算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向内存一端移动,然后直接清理掉边界以外的内存。

如下图所示:

分代式GC里,年老代常用 Mark-Sweep 或者 Mark-Sweep/Mark-Compact 的混合方式,一般情况下用 Mark-Sweep,统计估算碎片量达到一定程度时用 Mark-Compact。这是因为传统上大家认为年老代的对象可能会长时间存活且存活率高,拷贝起来不划算,不如采用就地收集的方式。


增量算法

增量算法的基本思想是,如果一次性将所有的垃圾进行处理,需要造成系统长时间的停顿,因此可以让垃圾收集线程和应用程序线程交替执行。每次垃圾收集线程只收集一小片区域的内存空间,接着切换到应用程序线程。依次反复,直到垃圾收集完成。

使用这种方式,由于在垃圾回收过程中,间断性地还执行了应用程序代码,所以能减少系统的停顿时间。但是线程切换和上下文转换带来的消耗,会使得垃圾回收的总体成本上升,造成系统吞吐量的下降。

参考链接:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值