JVM垃圾回收机制

1、概述

垃圾回收(Garbage Collection,GC)一直是Java开发在面试时常被问及的问题,部分同学在实际开发中可能会在项目中设计调优,但一般都是网上找找资料,一遍一遍的试,并没有真正理解什么是垃圾回收。了解垃圾回收的机制,更有利于我们日常的开发工作。垃圾回收,顾名思义就是释放垃圾占用的空间,防止内存泄露。有效的使用可以使用的内存,对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收。

2、垃圾判定

2.1、引用计数法

为每个对象增加一个计数器,当该对象被引用时,计数器加一,当引用失效时,计数器减一。当计数器为零时,该对象就可以被回收了。其缺点是:无法解决循环引用的问题。

2.2、可达性分析算法

通过GC Root的对象作为起始节点,通过引用向下搜索,所走过的路径称为引用链。当对象没有任何一条引用链链接的时候,就会被认定为垃圾。

可作为GC Root的对象:(类加载器,Thread,虚拟机栈的本地变量表,static成员,常量引用,本地方法栈的变量等等)

    1、虚拟机栈中引用的对象。

    2、方法区中类静态属性引用的对象。

    3、方法区中常量引用的对象。

    4、本地方法栈中引用的对象。

3、垃圾回收算法

3.1、标记-清除算法

标记清除算法(Mark-Sweep)是最基础的一种垃圾回收算法,它分为2部分,先把内存区域中的这些对象进行标记,哪些属于可回收标记出来,然后把这些垃圾拎出来清理掉。就像上图一样,清理掉的垃圾就变成未使用的内存区域,等待被再次使用。但它存在两个不足之处,第一,效率低,标记和清除两个动作要遍历所有对象,并且在GC时,需要停止应用程序,不适用于交互要求高的程序。第二,内存碎片化严重。

3.2、复制算法

为了解决效率问题,复制算法(Copying)出现了。它的策略是将内存分为大小相同的两块,每次只使用一块。当这块内存使用完后,就将存活的对象复制到另一块区,然后把空间一次清理掉。这样既保证了内存的连续使用,也不会有内存碎片化的情况。缺点是,硬盘使用率被大大降低了。Java堆年轻代使用这种算法。因为年轻代的特点是更新速度快,在短时间产生大量的“死亡对象”。

3.3、标记-整理算法

标记-整理算法标记过程与标记-清除算法类似,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域。这样做解决了内存碎片的问题,也规避了复制算法只能使用一半内存的缺点。Java堆老年代使用这种算法。

3.4、分析收集算法

分代收集算法分代收集算法严格来说并不是一种思想或理论,而是融合上述3种基础的算法思想,而产生的针对不同情况所采用不同算法的一套组合拳,根据对象存活周期的不同将内存划分为几块。

    1、在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。

    2、在老年代中,因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记-清理算法或者标记-整理算法来进行回收。

4、垃圾收集器

4.1、Serial收集器

特点:1、出现的最早的,发展最悠久的垃圾收集器。2、单线程、效率高。3、收集器进行垃圾回收时,必须暂停所有工作线程,直到结束(Stop The World)。

缺点:性能较慢

应用场景:在客户端上运行还是比较有效。没有线程的开销,所以在客户端还是比较好用的。

4.2、ParNew收集器

ParNew收集器其实就是Serial收集器的多线程版本。除了使用多线程外其余行为均和Serial收集器一模一样。

特点:1、多线程,默认开启收集线程与CPU数量相同。在CPU非常多的环境中,可以使用-XX:ParallelGCThreads参数来限制垃圾收集的线程数。

缺点:性能较慢

应用场景:ParNew收集器是许多运行在Server模式下的虚拟机中首选的新生代收集器,因为它是除了Serial收集器外,唯一一个能与CMS收集器配合工作的。

4.3、Parallel Scavenge收集器

主用算法:复制算法(年轻代收集器)

吞吐量 = (执行用户代码消耗的时间)/(执行用户代码的时间)+ 垃圾回收时所占用的时间

优点:吞吐量优化(CPU用于运行用户代码的时间与CPU消耗的总时间的比值)

关于控制吞吐量的参数:-XX:MaxGCPauseMills 垃圾收集器的停顿时间 -XX:GCTimeRatio 吞吐量大小

当停顿时间过小时,内存对应变小,回收的频率增大。因此第一个参数需要设置的合理才比较好。第二个参数值越大,吞吐量越大,默认是99,(垃圾回收时间最多只能占到1%)

总的来说:客户端可用,服务端最好不用。

4.4、CMS收集器

采用算法:标记清除算法。

  • 工作过程:
    • 初始标记
    • 并发标记
    • 重新标记
    • 并发清理
  • 优点:
    • 并发收集
    • 低停顿
  • 缺点:
    • 占用大量的CPU资源
    • 无法处理浮动垃圾
    • 出现ConcurrentMode Failure
    • 空间碎片

CMS是一个并发的收集器。

4.5、G1收集器

最牛的垃圾收集器。

  • 历史
    -2004年Sun发表了第一篇G1的论文,到2006年左右,在JDK6内集成进去了。JDK7才放出来。
  • 优势
    • 集中了前面所有收集器的优点
    • G1能充分利用了多核的并行特点,能缩短停顿时间。
    • 分代收集(分成各种Region)
    • 空间整合(类似于标记清理算法)
    • 可预测的停顿()。
  • 步骤
    • 初始标记
    • 并发标记
    • 最终标记
    • 筛选回收

5、内存区域和回收策略

Java 中的堆是 JVM 所管理的最大的一块内存空间,主要用于存放各种类的实例对象,如下图所示: 

在 Java 中,堆被划分成两个不同的区域:新生代 ( Young )、老年代 ( Old)。新生代 ( Young ) 又被划分为三个区域:Eden、Survivor(From区、To区交替使用)。 

Java 中的堆也是 GC 收集垃圾的主要区域。GC 分为两种:Minor GC、Full GC ( 或称为 Major GC )。

5.1、年轻代

5.1.1、Eden区

大多数情况下,对象会在年轻代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机会发起一次 Minor GC。Minor GC相比Major GC更频繁,回收速度也更快。通过Minor GC之后,Eden区中绝大部分对象会被回收,而那些存活对象,将会送到Survivor的From区(若From区空间不够,则直接进入Old区)。

5.1.2、Survivor区

Survivor区相当于是Eden区和Old区的一个缓冲,类似于我们交通灯中的黄灯。Survivor又分为2个区,一个是From区,一个是To区。每次执行Minor GC,会将Eden区中存活的对象放到Survivor的From区,而在From区中,仍存活的对象会根据他们的年龄值来决定去向。(From Survivor和To Survivor的逻辑关系会发生颠倒: From变To , To变From,目的是保证有连续的空间存放对方,避免碎片化的发生)。

5.2、老年代

5.2.1、大对象直接进入老年代

需要大量连续内存空间的Java对象,称为大对象。如:很长的字符串或数组。虚拟机提供XX:PretenureSizeThreshold参数,令大于这个设置值的对象直接在老年代分配内存。

5.2.2、长期存活的对象将进入老年代

虚拟机为每个对象定义一个计数器(Age),对象没经历一次Minor GC,年龄就会增加1,当年龄增加到一定程度(默认15岁)时,就会晋升到老年代中。这个阈值可以通过参数XX:MaxPretenuringThreshold设置。

5.2.3、超过动态年龄的对象将进入老年代

为了更好的适应不同程度的内存状况,虚拟机并不是将对象年龄作为唯一晋升老年代判定,如果Survivor空间中相同年龄的所有对象大小总和大于Servivor空间的一半,则年龄大于或等于该年龄的对象直接进入老年代。

PS:最后,感谢老匡同学的慧眼,帮忙指出文章中的问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值