java垃圾回收算法以及垃圾回收器

最新推荐文章于 2022-12-03 21:15:51 发布

一只路上的小菜鸟

最新推荐文章于 2022-12-03 21:15:51 发布

阅读量124

点赞数

文章标签： jvm java

本文链接：https://blog.csdn.net/weixin_41779703/article/details/107342449

版权

在java中,自动化的管理内存资源,垃圾回收机制必须要有一套算法来计算,那些是有效的对象,那些是无效的对象,对于无效的对象要进行回收处理,常见的计算无效对象的方法有两种:引用计数法,可达性分析算法.

引用计数算法:

原理:

假设有一个对象A,任何一个对对象A的引用,那么对象A的引用计数器+1,当引用失效是\时就-1,如果对象A的引用计数器为0,就说明A没有引用了,可以被回收.

优点:

   1.实时性较高，无需等到内存不够的时候，才开始回收，运行时根据对象的计数器是否为0，就可以直接回收。
   2.在垃圾回收过程中，应用无需挂起。如果申请内存时，内存不足，则立刻报outofmember 错误。
   3.区域性，更新对象的计数器时，只是影响到该对象，不会扫描全部对象。

缺点:

1.每次对象被引用时，都需要去更新计数器，有一点时间开销。
2.浪费CPU资源，即使内存够用，仍然在运行时进行计数器的统计。
3.无法解决循环引用问题。（最大的缺点）

可达性分析算法

通过一系列称为“GC Roots”的根对象作为起始节点集，从这些节点开始，根据引用关系向下搜索，搜索过程所走过的路径称为“引用链”（Reference Chain），如果某个对象到GC Roots间没有任何引用链相连，就说明从GC Roots 到这个对象不可达时，则证明此对象是不可能再被使用的，就是可以回收的对象。

在JVM虚拟机中，可作为GC Roots的对象包括以下几种：

在虚拟机栈（栈帧中的本地变量表）中引用的对象，譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。

在方法区中类静态属性引用的对象，譬如Java类的引用类型静态变量。

在方法区中常量引用的对象，譬如字符串常量池（String Table）里的引用。

在本地方法栈中JNI（即通常所说的Native方法）引用的对象。

Java虚拟机内部的引用，如基本数据类型对应的Class对象，一些常驻的异常对象（比如

NullPointExcepiton、OutOfMemoryError）等，还有系统类加载器。

所有被同步锁（synchronized关键字）持有的对象。

反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

垃圾收集算法:

标记清除法

标记清除算法，是将垃圾回收分为2个阶段，分别是标记和清除。

标记：从根节点开始标记引用的对象。

清除：未被标记引用的对象就是垃圾对象，可以被清理。

标记清除法可以说是基础的收集算法，因为后续的收集算法大多都是以标记-清除算法为基础，对其缺点进行改进而得到的。

缺点:

执行效率较低，标记和清除两个动作都需要遍历所有的对象，并且在GC时，需要停止应用程序，对于交互性要求比较高的应用而言这个体验是非常差的。

通过标记清除算法清理出来的内存，碎片化较为严重，因为被回收的对象可能存在于内存的各个角落，所以清理出来的内存是不连贯的。

标记压缩算法:

标记压缩算法是在标记清除算法的基础之上，做了优化改进的算法。和标记清除算法一样，也是从根节点开始，对对象的引用进行标记，在清理阶段，并不是简单的清理未标记的对象，而是将存活的对象压缩到内存的一端，然后清理边界以外的垃圾，从而解决了碎片化的问题。

该算法解决了标记清除算法的碎片化的问题，同时，标记压缩算法多了一步，对象移动内存位置的步骤，其效率也有一定的影响。

标记复制算法:

复制算法的核心就是，将原有的内存空间一分为二，每次只用其中的一块，在垃圾回收时，将正在使用的对象复制到另一个内存空间中，然后将该内存空间清空，交换两个内存的角色，完成垃圾的回收。

如果内存中的垃圾对象较多，需要复制的对象就较少，这种情况下适合使用该方式并且效率比较高，反之，则不适合。

JVM中年轻代内存空间

在GC开始的时候，对象只会存在于Eden区和名为“From”的Survivor区，Survivor区“To”是空的。

紧接着进行GC，Eden区中所有存活的对象都会被复制到“To”，而在“From”区中，仍存活的对象会根据他们的年龄值来决定去向。年龄达到一定值(年龄阈值，可以通过-XX:MaxTenuringThreshold来设置)的对象会被移动到年老代中，没有达到阈值的对象会被复制到“To”区域。

经过这次GC后，Eden区和From区已经被清空。这个时候，“From”和“To”会交换他们的角色，也就是新

的“To”就是上次GC前的“From”，新的“From”就是上次GC前的“To”。不管怎样，都会保证名为To的Survivor区域是空的。

GC会一直重复这样的过程，直到“To”区被填满，“To”区被填满之后，会将所有对象移动到年老代中。

优缺点

优点：

在垃圾对象多的情况下，效率较高清理后，内存无碎片

缺点：

在垃圾对象少的情况下，不适用，如：老年代内存

分配的2块内存空间，在同一个时刻，只能使用一半，内存使用率较低

分代算法:

在堆内存中，有些对象短暂存活有些则是长久存活，所以需要将堆内存进行分代，将短暂存活的对象放到一起，进行高频率的回收，长久存活的对象集中放到一起，进行低频率的回收，这样才能够更加合理的利系统资源。

分代算法其实就是这样的，根据回收对象的特点进行选择，在jvm中，年轻代适合使用复制算法，老年代适合使用标记清除或标记压缩算法。

垃圾回收的相关概念：

部分收集（Partial GC）

新生代收集（Minor GC/Young GC）：指目标只是新生代的垃圾收集。

老年代收集（Major GC/Old GC）：指目标只是老年代的垃圾收集。

混合收集（Mixed GC）：指目标是收集整个新生代以及部分老年代的垃圾收集。

整堆收集（Full GC）

垃圾收集器

在jvm中，实现了多种垃圾收集器，包括：串行垃圾收集器、并行垃圾收集器、CMS（并发）垃圾收集器、G1垃圾收集器，

在HotSpot虚拟机中，常见的集中垃圾收集器组合方式：

串行垃圾收集器:

串行垃圾收集器，是指使用单线程进行垃圾回收，垃圾回收时，只有一个线程在工作，并且java应用中的所有线程都要暂停，等待垃圾回收的完成。这种现象称之为STW（Stop-The-World）。

对于交互性较强的应用而言，这种垃圾收集器是不能够接受的。

一般在Javaweb应用中是不会采用该收集器的。

并行垃圾收集器:

并行垃圾收集器在串行垃圾收集器的基础之上做了改进，将单线程改为了多线程进行垃圾回收，这样可以缩短垃圾

回收的时间。（这里是指，并行能力较强的机器）

当然了，并行垃圾收集器在收集的过程中也会暂停应用程序，这个和串行垃圾回收器是一样的，只是并行执行，速度更快些，暂停的时间更短一些。

ParNew垃圾收集器:

ParNew垃圾收集器是工作在年轻代上的，只是将串行的垃圾收集器改为了并行。通过-XX:+UseParNewGC参数设置年轻代使用ParNew回收器，老年代使用的依然是串行收集器。

ParallelGC垃圾收集器:

ParallelGC收集器工作机制和ParNewGC收集器一样，只是在此基础之上，新增了两个和系统吞吐量相关的参数，使得其使用起来更加的灵活和高效。

相关参数如下：

-XX:+UseParallelGC 年轻代使用ParallelGC垃圾回收器，老年代使用串行回收器。

-XX:+UseParallelOldGC 年轻代使用ParallelGC垃圾回收器，老年代使用ParallelOldGC垃圾回收器。

-XX:MaxGCPauseMillis 设置大的垃圾收集时的停顿时间，单位为毫秒

需要注意的时，ParallelGC为了达到设置的停顿时间，可能会调整堆大小或其他的参数，如果堆的大小设置的较小，就会导致GC工作变得很频繁，反而可能会影响到性能。

该参数使用需谨慎。

-XX:GCTimeRatio 设置垃圾回收时间占程序运行时间的百分比，公式为1/(1+n)。

它的值为0~100之间的数字，默认值为99，也就是垃圾回收时间不能超过1%

-XX:UseAdaptiveSizePolicy 自适应GC模式，垃圾回收器将自动调整年轻代、老年代等参数，达到吞吐量、堆大小、停顿时间之间的平衡。一般用于手动调整参数比较困难的场景，让收集器自动进行调整。

CMS垃圾收集器:

CMS全称 Concurrent Mark Sweep，是一款并发的、使用标记-清除算法的垃圾回收器，该回收器是针对老年代垃圾回收的，通过参数-XX:+UseConcMarkSweepGC进行设置。

G1垃圾收集器:

G1垃圾收集器是在jdk7中正式使用的全新的垃圾收集器，oracle官方计划在jdk9中将G1变成默认的垃圾收集器，以替代CMS。

G1的设计原则就是简化JVM性能调优，开发人员只需要简单的三步即可完成调优：

第一步，开启G1垃圾收集器
第二步，设置堆的大内存
第三步，设置大的停顿时间

G1中提供了三种模式垃圾回收模式，Young GC、Mixed GC 和 Full GC，在不同的条件下被触发。

G1垃圾收集器相对比其他收集器而言，大的区别在于它取消了年轻代、老年代的物理划分，取而代之的是将堆划分为若干个区域（Region），这些区域中包含了有逻辑上的年轻代、老年代区域。

这样做的好处就是，我们再也不用单独的空间对每个代进行设置了，不用担心每个代内存是否足够。

在G1划分的区域中，年轻代的垃圾收集依然采用暂停所有应用线程的方式，将存活对象拷贝到老年代或者Survivor 空间，G1收集器通过将对象从一个区域复制到另外一个区域，完成了清理工作。

这就意味着，在正常的处理过程中，G1完成了堆的压缩（至少是部分堆的压缩），这样也就不会有cms内存碎片问题的存在了。

在G1中，有一种特殊的区域，叫Humongous区域。

如果一个对象占用的空间超过了一个分区容量50%以上，G1收集器就认为这是一个巨型对象。

这些巨型对象，默认直接会被分配在老年代，但是如果它是一个短期存在的巨型对象，就会对垃圾收集器造成负面影响。

为了解决这个问题，G1划分了一个Humongous区，它用来专门存放巨型对象。如果一个H区装不下一个巨型

对象，那么G1会寻找连续的H分区来存储。为了能找到连续的H区，有时候不得不启动Full GC。

每个Region的大小可以通过参数-XX：G1HeapRegionSize设定，取值范围为1MB～32MB，且应为2的N次幂。

G1:Young GC

Young GC主要是对Eden区进行GC，它在Eden空间耗尽时会被触发。

Eden空间的数据移动到Survivor空间中，如果Survivor空间不够，Eden空间的部分数据会直接晋升到年老代

根对象可能是在年轻代中，也可以在老年代中，那么老年代中的所有对象都是根么？如果全量扫描老年代，那么这样扫描下来会耗费大量的时间。

于是，G1引进了RSet的概念。它的全称是Remembered Set，其作用是跟踪指向某个堆内的对象引用。

每个Region初始化时，会初始化一个RSet，该集合用来记录并跟踪其它Region指向该Region中对象的引用，每个

Region默认按照512Kb划分成多个Card，所以RSet需要记录的东西应该是 xx Region的 xx Card。

G1:Mixed GC

当越来越多的对象晋升到老年代old region时，为了避免堆内存被耗尽，虚拟机会触发一个混合的垃圾收集器，即

Mixed GC，该算法并不是一个Old GC，除了回收整个Young Region，还会回收一部分的Old Region，这里需要注意：是一部分老年代，而不是全部老年代，可以选择哪些old region进行收集，从而可以对垃圾回收的耗时时间进行控制。也要注意的是Mixed GC 并不是 Full GC。

MixedGC什么时候触发？由参数 -XX:InitiatingHeapOccupancyPercent=n 决定。默认：45%，该参数的意思是：当老年代大小占整个堆大小百分比达到该阀值时触发。

它的GC步骤分2步：

全局并发标记（global concurrent marking）

拷贝存活对象（evacuation）

全局并发标记全局并发标记，执行过程分为五个步骤：

1.初始标记（initial mark，STW）

标记从根节点直接可达的对象，这个阶段会执行一次年轻代GC，会产生全局停顿。

2.根区域扫描（root region scan）

G1 GC 在初始标记的存活区扫描对老年代的引用，并标记被引用的对象。

该阶段与应用程序（非 STW）同时运行，并且只有完成该阶段后，才能开始下一次 STW 年轻代垃圾回收。

3.并发标记（Concurrent Marking）

G1 GC 在整个堆中查找可访问的（存活的）对象。该阶段与应用程序同时运行，可以被 STW 年轻代垃圾回收中断。

4.重新标记（Remark，STW）

该阶段是 STW 回收，因为程序在运行，针对上一次的标记进行修正。

5.清除垃圾（Cleanup，STW）

清点和重置标记状态，该阶段会STW，这个阶段并不会实际上去做垃圾的收集，等待evacuation阶段来回收。

拷贝存活对象

Evacuation阶段是全暂停的。该阶段把一部分Region里的活对象拷贝到另一部分Region中，从而实现垃圾的回收清理。

G1收集器相关参数

-XX:+UseG1GC

使用 G1 垃圾收集器

-XX:MaxGCPauseMillis

设置期望达到的大GC停顿时间指标（会尽力实现，但不保证达到），默认值是 200 毫秒。

-XX:G1HeapRegionSize=n

设置的 G1 区域的大小。值是 2 的幂，范围是 1 MB 到 32 MB 之间。目标是根据小的 Java 堆大小划分出约 2048 个区域。

默认是堆内存的1/2000。

-XX:ParallelGCThreads=n

设置 STW 工作线程数的值。将 n 的值设置为逻辑处理器的数量。n 的值与逻辑处理器的数量相同，多为 8。

-XX:ConcGCThreads=n

设置并行标记的线程数。将 n 设置为并行垃圾回收线程数 (ParallelGCThreads) 的 1/4 左右。

-XX:InitiatingHeapOccupancyPercent=n

设置触发Mixed GC 的Java 堆占用率阈值。默认占用率是整个 Java 堆的 45%。

一只路上的小菜鸟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java垃圾回收算法以及垃圾回收器

在java中,自动化的管理内存资源,垃圾回收机制必须要有一套算法来计算,那些是有效的对象,那些是无效的对象,对于无效的对象要进行回收处理,常见的计算无效对象的方法有两种:引用计数法,可达性分析算法.引用计数算法:原理: 假设有一个对象A,任何一个对对象A的引用,那么对象A的引用计数器+1,当引用失效是\时就-1,如果对象A的引用计数器为0,就说明A没有引用了,可以被回收.优点: 1.实时性较高，无需等到内存不够的时候，才开始回收，运行时根据对象的计数器是否为0...
复制链接

扫一扫