JVM垃圾回收

在Java中,我们程序员是不需要手动释放一些无用的内存的,而是由虚拟机自行执行。这在一定程度上确保了内存泄露的发生,给我们提供了一个更加安全的环境,接下来我们就来认识一下JVM的垃圾回收机制。

#GC

GC 名为垃圾收集器(Gabage Collection),当我们创建一个对象时JVM所提供的GC就会开始对这个对象的监测,通常,GC采用有向图的方式记录和管理堆(heap)中的所有对象。通过这种方式确定哪些对象是"可达的",哪些对象是"不可达的"。当GC确定一些对象为"不可达"时,GC就有责任回收这些内存空间。

#判断一个对象是否能被回收

既然要回收对象,那么我们就需要来判断一个对象是否可以被JVM回收,通常用来判断的方法有两个。

1.引用计数法

引用计数描述的算法为: 给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1;任 何时刻计数器为0的对象就是不能再被使用的,即对象已"死"。 引用计数法实现简单,判定效率也比较高,在大部分情况下都是一个不错的算法。比如Python语言就采 用引用计数法进行内存管理。 但是,在主流的JVM中没有选用引用计数法来管理内存,最主要的原因就是引用计数法无法解决对象的循环引用问题。

循环引用问题

public class Test {
 public Object instance = null;
 private static int _1MB = 1024 * 1024;
 private byte[] bigSize = new byte[2 * _1MB];
 public static void testGC() {
 Test test1 = new Test();
 Test test2 = new Test();
 test1.instance = test2;
 test2.instance = test1;
 test1 = null;
 test2 = null;
 // 强制jvm进行垃圾回收
 System.gc();
 }
 public static void main(String[] args) {
 testGC();
 }
}

在上述代码中,我们分别在test1和test2对象中的instance变量中分别引用对方,之后我们将test1与test2置空,意味着此时我们应该回收它们,但是这两个对象依旧被互相引用,它们互相的引用计数都为1,也就是说如果要回收test1就要先回收test2,要回收test2就要先回收test1,这样就进入了一个死循环,就好比我们线程的死锁。一下是代码的执行结果:

[GC (System.gc())  6092K->856K(125952K), 0.0007504 secs] 

从结果可以看出,GC日志包含" 6092K->856K(125952K)",意味着虚拟机并没有完成回收。

可达性分析

在上面我们讲了,Java并不采用引用计数法来判断对象是否已"死",而采用"可达性分析"来判断对象是 否存活(同样采用此法的还有C#、Lisp-最早的一门采用动态内存分配的语言)。 此算法的核心思想为 : 通过一系列称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索 走过的路径称之为"引用链",当一个对象到GC Roots没有任何的引用链相连时(从GC Roots到这个对象 不可达)时,证明此对象是不可用的。

#JVM垃圾回收算法

既然我们已经了解了JVM如何判断一个对象是否存活,那么我们就可以开始对了解JVM如何将那不在被引用的对象 进行销毁。

1.标记清除法

"标记-清除"算法是最基础的收集算法。算法分为"标记"和"清除"两个阶段 : 首先标记出所有需要回收的对象(即那些不在被引用的对象),在标记完成后统一回收所有被标记的对象。后续的收集算法都是基于这种 思路并对其不足加以改进而已。 "标记-清除"算法的不足主要有两个 :

1. 效率问题 : 标记和清除这两个过程的效率都不高 2. 空间问题 : 标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行中 需要分配较大对象时,无法找到足够连续内存而不得不提前触发另一次垃圾收集。

如上图,我们可知在用该方法回收无用对象后产生了大量的内存碎片,这对于我们的空间利用是极其不利的,如下图

2.复制算法

"复制"算法是为了解决"标记-清理"的效率问题。它将可用内存按容量划分为大小相等的两块,每次只使 用其中的一块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另一块上面,然后 再把已经使用过的内存区域一次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配 时也就不需要考虑内存碎片等复杂情况,只需要移动堆顶指针,按顺序分配即可。此算法实现简单,运行高效。算法的执行流程如下图 : 

但该算法的缺点也是显而易见的,就是空间的利用率只有一半,每次都只能使用一半的内存空间。

3.标记整理算法

复制算法在对象存活率较高时会进行比较多的复制操作,效率会变低。因此在老年代一般不能使用 复制算法。 针对老年代的特点,提出了一种称之为"标记-整理算法"。标记过程仍与"标记-清除"过程一致,但后续步骤不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉端边界以外的 内存。流程图如下:

4.分代算法

分代算法和上面讲的 3 种算法不同,分代算法是通过区域划分,实现不同区域和不同的垃圾回收策略, 从而实现更好的垃圾回收。对于不同的情况和地域设置更符合当地 的规则,从而实现更好的管理,这就时分代算法的设计思想。 当前 JVM 垃圾收集都采用的是"分代收集(Generational Collection)"算法,这个算法并没有新思想,只 是根据对象存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代。在新生代中,每 次垃圾回收都有大批对象死去,只有少量存活,因此我们采用复制算法;而老年代中对象存活率高、没 有额外空间对它进行分配担保,就必须采用"标记-清理"或者"标记-整理"算法。

在我们开辟的内存中,我们将其分为新生代和老年代,其中新生代占内存的1/3,老年代占2/3。在新生代中又可以分为Eden,Survivor From, Survivor To 三个区,分别占比为8:1:1.

当GC开始时,对象被创建在Eden区中当Eden区达到某个内存阈值时会将存活的对象转入from区,之后每进行一次GC在依然存活对象就会在from与to区中来回切换,每次切换存活的对象的年龄就会加一,当年龄达到某个值时(默认为15)就会将该对象移入老年代。同时,我们如果创建了一个大对象,那么这个对象会直接被放入老年代,这是因为在from与to区中来回复制一个大对象是十分消耗资源的。最后说明一下,在新生代中进行的GC成为”Minor GC“.

当我们将对象放入老年代后,如果老年代区域所用的内存达到阈值就会开始对老年代的GC,称为”Full GC“或者”Major GC “。

5.”Minor GC“与”Major GC“

1. Minor GC又称为新生代GC : 指的是发生在新生代的垃圾收集。因为Java对象大多都具备朝 生夕灭的特性,因此Minor GC(采用复制算法)非常频繁,一般回收速度也比较快。

2. Full GC 又称为 老年代GC或者Major GC : 指发生在老年代的垃圾收集。出现了Major GC, 经常会伴随至少一次的Minor GC(并非绝对,在Parallel Scavenge收集器中就有直接进行 Full GC的策略选择过程)。Major GC的速度一般会比Minor GC慢10倍以上。

最后

本文中图片来源于网络。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值