JVM垃圾回收详解

每天都在努力学JAVA

已于 2023-04-24 23:39:16 修改

阅读量250

点赞数

文章标签： jvm java 算法

于 2023-04-05 16:59:26 首次发布

本文链接：https://blog.csdn.net/Swallow_A/article/details/129971443

版权

如何判断对象是否死亡？

1.引用计数算法
每当有一个地方引用它，计数器就加 1；
当引用失效，计数器就减 1；
任何时候计数器为 0 的对象就是不可能再被使用的。
这个方法实现简单，效率高，但是目前主流的虚拟机中并没有选择这个算法来管理内存，其最主要的原因是它很难解决对象之间相互循环引用的问题。
2.可达性分析算法
目前主流的商用语言JAVA、C#等都是采用可达性分析来判断对象是否存活，如果某对象到GCroot之间没有任何引用则证明该对象是不可能再被使用的。
在这里插入图片描述
3.哪些对象可以作为GC Root？

虚拟机栈(栈帧中的本地变量表)中引用的对象（正在运行方法中的参数、局部变量、临时变量）
本地方法栈(Native 方法)中引用的对象
方法区中类静态属性引用的对象（Java类的引用类型静态变量）
方法区中常量引用的对象（String table中的引用）
所有被同步锁持有的对象

4.引用类型总结
无论是通过引用计数法判断对象引用数量，还是通过可达性分析法判断对象的引用是否可达，判定对象的存活都与“引用”有关。
JDK1.2 之前，Java 中引用的定义很传统：如果 reference 类型的数据存储的数值代表的是另一块内存的起始地址，就称这块内存代表一个引用。
JDK1.2 以后，Java 对引用的概念进行了扩充，将引用分为强引用、软引用、弱引用、虚引用四种（引用强度逐渐减弱）。
强引用：只要强引用存在就不会被回收（new）
软引用：如果内存空间足够，垃圾回收器就不会回收它，如果内存空间不足了，就会回收这些对象的内存。只要垃圾回收器没有回收它，该对象就可以被程序使用。软引用可用来实现内存敏感的高速缓存。
弱引用：弱引用与软引用的区别在于：只具有弱引用的对象拥有更短暂的生命周期。在垃圾回收器线程扫描它所管辖的内存区域的过程中，一旦发现了只具有弱引用的对象，不管当前内存空间足够与否，都会回收它的内存。
虚引用：又称“幽灵引用”，设置虚引用的目的是为了在这个对象被回收时收到一个系统通知。
5.是否对象真的死亡？
在发现没有与GC Root相连接的引用，将筛选该对象是否有必要执行finalize(),若需要执行finalize()方法则该对象才会被放入F-Queue中。
6.判断一个常量是否为废弃常量？
假如在字符串常量池中存在字符串 “abc”，如果当前没有任何 String 对象引用该字符串常量的话，就说明常量 “abc” 就是废弃常量，如果这时发生内存回收的话而且有必要的话，“abc” 就会被系统清理出常量池了。
7.判断一个类是否为废弃类？
该类所有的实例都已经被回收，也就是 Java 堆中不存在该类的任何实例。
加载该类的 ClassLoader 已经被回收。
该类对应的 java.lang.Class 对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法。

垃圾收集算法

垃圾收集算法可以划分为“引用计数式垃圾收集”和"追踪式垃圾收集"，也称为直接垃圾收集和间接垃圾收集，目前主要的垃圾收集器是采用的追踪式垃圾收集。
1.分代收集理论
当前商用的虚拟垃圾收集器都是基于“分代收集”的理论进行设计的。
GC目前分为两种：
部分收集 (Partial GC)：
新生代收集（Minor GC / Young GC）：只对新生代进行垃圾收集；
老年代收集（Major GC / Old GC）：只对老年代进行垃圾收集。需要注意的是 Major GC 在有的语境中也用于指代整堆收集；
混合收集（Mixed GC）：对整个新生代和部分老年代进行垃圾收集。
整堆收集 (Full GC)：收集整个 Java 堆和方法区。
2.标记-清除算法 （CSM就是采用的标记-清楚垃圾回收算法，会产生大量的空间碎片）
该算法分为“标记”和“清除”阶段：首先标记出所有不需要回收的对象，在标记完成后统一回收掉所有没有被标记的对象。它是最基础的收集算法，后续的算法都是对其不足进行改进得到。
这种垃圾收集算法会带来两个明显的问题：
1.执行效率不稳定，执行效率随对象的数量增长而降低。
2.空间问题（标记清除后会产生大量不连续的碎片）
在这里插入图片描述
2. 标记-复制算法
为了解决效率问题，“标记-复制”收集算法出现了。它可以将内存分为大小相同的两块，每次使用其中的一块。当这一块的内存使用完后，就将还存活的对象复制到另一块去，然后再把使用的空间一次清理掉。这样就使每次的内存回收都是对内存区间的一半进行回收。
1969年。Fenichel提出“半区复制”的垃圾回收算法，每次仅使用其中一半，就将还存活着的对象复制到另外一块。这种方法，空间浪费大，但是不存在空间碎片。

1989年，提出appel式回收方法，Serial、ParNew均采用了这种分区方法，具体是将新生代分为一个较大的Eden空间和两个较小的Survivor空间，分配内存仅使用Eden和一块Survivor空间（Eden：Survivor=8：1默认），发生垃圾回收时将仍然存活的对象一次性复制到另外一块Survivor上，，若空间不够则通过分配担保机制直接进入老年代。
在这里插入图片描述
3.标记-整理算法
根据老年代的特点提出的一种标记算法，标记过程仍然与“标记-清除”算法一样，但后续步骤不是直接对可回收对象回收，而是让所有存活的对象向一端移动，然后直接清理掉端边界以外的内存。Parallel Old收集器是基于标记整理、关注延迟的CMS是基于标记－清楚的。
在这里插入图片描述

HotSpot算法实现细节

1.根节点枚举
迄今为止，所有收集器在根节点枚举这一步骤都是需要暂停所有用户线程的，因为需要保证根节点集合的对象引用关系不变化。在HotSpot中，是使用一种OopMap的数据结构在实现获取所有的对象关系引用的，且仅在安全点才记录所有Oop Maps。（安全区域是指在某一个代码片段中，引用关系不会发生变化的区域。
如何使线程在垃圾回收时到最近的安全点然后停顿下来，1）抢先式中断 2）主动式中断。
2.记忆集与卡表
垃圾收集器在新生代中建立了记忆集来记录是否存在跨代引用，收集器只需要通过记忆集判断某一块收集区域是否存在指向非收集区域的指针。

经典的垃圾收集器

在这里插入图片描述
1.Serial收集器
Serial（串行）收集器是最基本、历史最悠久的垃圾收集器了。大家看名字就知道这个收集器是一个单线程收集器了。它的 “单线程” 的意义不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作，更重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程（ “Stop The World” ），直到它收集结束。
新生代采用标记-复制，老年代采用标记-整理。
但是 Serial 收集器有没有优于其他垃圾收集器的地方呢？当然有，它简单而高效（与其他收集器的单线程相比）。Serial 收集器由于没有线程交互的开销，自然可以获得很高的单线程收集效率。Serial 收集器对于运行在 Client 模式下的虚拟机来说是个不错的选择。

2.ParNew收集器
ParNew 收集器其实就是 Serial 收集器的多线程版本，除了使用多线程进行垃圾收集外，其余行为（控制参数、收集算法、回收策略等等）和 Serial 收集器完全一样，除此之外他是目前除了Serial收集器之外，唯一能与CMS收集器配合工作。

３.Parrallel Scavenge收集器
Parallel Scavenge 收集器关注点是吞吐量（高效率的利用 CPU）。CMS 等垃圾收集器的关注点更多的是用户线程的停顿时间（提高用户体验）。所谓吞吐量就是 CPU 中用于运行用户代码的时间与 CPU 总消耗时间的比值。 Parallel Scavenge 收集器提供了很多参数供用户找到最合适的停顿时间或最大吞吐量，如果对于收集器运作不太了解，手工优化存在困难的时候，使用 Parallel Scavenge 收集器配合自适应调节策略，把内存管理优化交给虚拟机去完成也是一个不错的选择。

4.Serial Old收集器
Serial 收集器的老年代版本，它同样是一个单线程收集器。它主要有两大用途：一种用途是在 JDK1.5 以及以前的版本中与 Parallel Scavenge 收集器搭配使用，另一种用途是作为 CMS 收集器的后备方案。标记-整理

5.Parallel Old收集器
Parallel Scavenge 收集器的老年代版本。使用多线程和“标记-整理”算法。在注重吞吐量以及 CPU 资源的场合，都可以优先考虑 Parallel Scavenge 收集器和 Parallel Old 收集器，可以通过参数设置所需要的吞吐量。

6.CMS收集器
CMS（Concurrent Mark Sweep）收集器是一种以获取最短回收停顿时间为目标的收集器。它非常符合在注重用户体验的应用上使用。
CMS（Concurrent Mark Sweep）收集器是 HotSpot 虚拟机第一款真正意义上的并发收集器，它第一次实现了让垃圾收集线程与用户线程（基本上）同时工作。
整个过程分为四个步骤：

初始标记：暂停所有的其他线程，并记录下直接与 root 相连的对象，速度很快；
并发标记：同时开启GC和用户线程，用一个闭包结构去记录可达对象。但在这个阶段结束，这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域，所以GC线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
重新标记：重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录，这个阶段的停顿时间一般会比初始标记阶段的时间稍长，远远比并发标记阶段时间短。
并发清除：开启用户线程，同时 GC 线程开始对未标记的区域做清扫。
初始标记和重新标记都需要Stop the world.

它的名字就可以看出它是一款优秀的垃圾收集器，主要优点：并发收集、低停顿。但是它有下面三个明显的缺点：
对 CPU 资源敏感；无法处理浮动垃圾；它使用的回收算法-“标记-清除”算法会导致收集结束时会有大量空间碎片产生。

7.Garbage First收集器
G1 (Garbage-First) 是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足 GC 停顿时间要求的同时,还具备高吞吐量性能特征，整体式是标记-整理算法，两个区域之间是复制算法，优先收集垃圾最多的区域。
被视为 JDK1.7 中 HotSpot 虚拟机的一个重要进化特征。它具备以下特点：

并行与并发：G1 能充分利用 CPU、多核环境下的硬件优势，使用多个 CPU（CPU 或者 CPU 核心）来缩短
Stop-The-World 停顿时间。部分其他收集器原本需要停顿 Java 线程执行的 GC 动作，G1 收集器仍然可以通过并发的方式让
java 程序继续执行。
分代收集：虽然 G1 可以不需要其他收集器配合就能独立管理整个 GC 堆，但是还是保留了分代的概念。
空间整合：与 CMS 的“标记-清除”算法不同，G1从整体来看是基于“标记-整理”算法实现的收集器；从局部上来看是基于“标记-复制”算法实现的。
可预测的停顿：这是 G1 相对于 CMS 的另一个大优势，降低停顿时间是 G1 和 CMS 共同的关注点，但 G1
除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为 M 毫秒的时间片段内。

G1垃圾收集器是基于Region的堆内存布局，不再坚持固定大小数量的分代区域划分，而是将多个连续的Java堆划分为多个大小独立的区域，每个区域根据需要扮演新生代或是老年代。
1）G1垃圾回收阶段
在这里插入图片描述
1）Young Collection

E-Eden Region，创建的对象优先放入Eden去，在Eden区域需要垃圾回收时，将存活的对象放入Survivor区（S），S区需要垃圾回收时，进而将存活的对象放入老年区。
2）Young Collection + CM 初始标记和并发标记
在Young GC 时会进行 GC Root 的初始标记。
老年代占用堆空间比例达到阈值时，进行并发标记(不会 STW)，由下面的JVM 参数决 XX:InitiatingHeapOccupancyPercent=percent (默认45%)
3）Mixed Collection，对E、S、O进行全面垃圾回收，即最终标记和拷贝存活（都会Stop the world）。
在这里插入图片描述
G1回收速度跟不上垃圾处理速度就会触发full gc。
G1 和CMS都是采用卡表来处理跨代引用，用老年代引用新生代，当卡表存在新生代的引用则标记为脏卡。

CMS利用写后屏障来更新维护脏卡，G1除了采用写后屏障，还使用了写前屏障来跟踪并发时指针的变化情况，
G1垃圾回收器的优化-字符串去重
![在这里插入图片描述](https://img-blog.csdnimg.cn/c8962f90f28543848940ab6a2a9851e3.png
G1垃圾回收器的优化-回收巨型对象
一个对象大于 region 的一半时，称之为巨型对象
G1 不会对巨型对象进行拷贝
回收时被优先考虑
G1 会跟踪老年代所有 incoming 引用，这样老年代 incoming 引用为0 的巨型对象就可以在新生代垃圾回收时处理掉

每天都在努力学JAVA

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
JVM垃圾回收详解

每当有一个地方引用它，计数器就加 1；当引用失效，计数器就减 1；任何时候计数器为 0 的对象就是不可能再被使用的。这个方法实现简单，效率高，但是目前主流的虚拟机中并没有选择这个算法来管理内存，其最主要的原因是它目前主流的商用语言JAVA、C#等都是采用可达性分析来判断对象是否存活，如果某对象到GCroot之间没有任何引用则证明该对象是不可能再被使用的。
复制链接

扫一扫