文章目录
JVM垃圾回收机制
在C/C++这类没有自动垃圾回收机制的语言中,一个对象如果不再使用,需要程序要手动进行释放,否则就会出现内存泄露,这种释放对象的过程为垃圾回收,而需要程序员自己编写代码进行回收的方式称为手动回收。
内存泄露:指的是不再使用的对象再内存中未被回收,内存泄露的积累可能会导致内存溢出
会导致内存泄露的C语言代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
while (1)
{
int* ptr = (int*)malloc(12);
if (ptr == NULL)
{
printf("开辟内存失败 %s", strerror(errno));
}
}
return 0;
}
Java内存管理
Java中为了简化对象的释放,引入了自动的**垃圾回收(GC)**机制,通过垃圾回收器来对不再使用的对象完成自动的回收,垃圾回收器主要负责对堆上的内存进行回收。其他很多现代语言比如C#、 Python、 Go都拥有自己的垃圾回收器。
- 自动垃圾回收:自动根据对象是否使用由虚拟机来回收对象
- 优点:降低程序员实现难度,降低对象回收bug的可能性
- 缺点:程序员无法控制内存回收的及时性
- 手动垃圾回收:有程序员自主编程实现对象的删除
- 优点:回收的及时性高,由程序员把控回收的时机
- 缺点:编写不当容易出现内存泄露、重复释放、部分释放、对空指针进行释放等问题
线程不共享的部分,都是伴随着线程的创建而创建,线程的销毁而销毁。而方法的栈帧在执行完方法之后就会自动弹出栈并释放掉对应的内存。
方法区回收
在类加载阶段,类加载器加载完类之后,Java虚拟机会将字节码文件中的信息保存到方法区中生成一个InstanceKlass对象,保存类的所有信息,方法区中能回收的内容主要就是不再使用的类。
判定一个类可以被卸载。需要同时满足下面三个条件:
- 此类所有实例对象都已经被回收, 在堆中不存在任何该类的实例对象以及子类对象。
- 加载该类的类加载器已经被回收。
- 该类对应的 java.lang.Class 对象没有在任何地方被引用。
堆回收
Java中的对象是否能被回收,是根据对象是否被引用来决定的。如果对象被引用了,说明该对象还在使用,不允许被回收。
引用计数法
如何判断堆上的对象没有被引用?
常见的有两种判断方法:引用计数法和可达性分析法。
引用计数法会为每个对象维护一个引用计数器,当对象被引用时加1,取消引用时减1。
循环引用
引用计数法的优点是实现简单, C++中的智能指针就采用了引用计数法,但是它也存在缺点,主要有两点:
1.每次引用和取消引用都需要维护计数器,对系统性能会有一定的影响
2.存在循环引用问题,所谓循环引用就是当A引用B, B同时引用A时会出现对象无法回收的问题。
public class Test {
static class A {
B b;
}
static class B {
A a;
}
public static void main(String[] args) {
A a = new A();
B b = new B();
a.b = b;
b.a = a;
a = null;
b = null;
}
}
此时AB实例对象再栈上已经没有变量引用了,由于计数器还是1无法回收,就会出现内存泄露问题。
可达性分析算法
Java使用的是可达性分析算法来判断对象是否可以被回收。可达性分析将对象分为两类:垃圾回收的根对象(GCRoot)和普通对象,对象与对象之间存在引用关系。
可达性分析算法是如果从某个到GC Root对象是可达的,对象就不可被回收。如图:
哪些对对象是GC Root对象呢?
- 在虚拟机栈(栈帧中的局部变量表)中引用的对象
- 系统类加载器加载的java.lang.Class对象。
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 监视器对象,用来保存同步锁synchronized关键字持有的对象。
- 本地方法调用时使用的对象 ,也就是native方法引用的对象
常见对象引用
可达性算法中描述的对象引用,一般指的是强引用,即是GCRoot对象对普通对象有引用关系,只要这层关系存在,普通对象就不会被回收。除了强引用之外, Java中还设计了几种其他引用方式:
强引用
我们使用到到的引用一般都是强引用,这种引用Java虚拟机就算抛出内存溢出错误也不会将其回收。
软引用
软引用相对于强引用是一种比较弱的引用关系,如果一个对象软引用关联到它,当内存不足时,就会将软引用中的数据进行回收
在JDK 1.2版之后提供了SoftReference类来实现软引用, 软引用常用于缓存中 。
其实就是将对象包装一层,也就是软引用对象。
byte[] bytes = new byte[1024 * 1024 * 100];
SoftReference<byte[]> softReference = new SoftReference<byte[]>(bytes);
软引用的执行过程如下:
- 将对象使用软引用包装起来, new SoftReference<对象类型>(对象)。
- 内存不足时,虚拟机尝试进行垃圾回收。
- 如果垃圾回收仍不能解决内存不足的问题,回收软引用中的对象。
- 如果依然内存不足,抛出OutOfMemory异常。
软引用中的对象如果在内存不足时回收, SoftReference对象本身也需要被回收。 如何知道哪些SoftReference对象需要回收呢?
SoftReference提供了一套队列机制:
- 软引用创建时,通过构造器传入引用队列
- 在软引用中包含的对象被回收时,该软引用对象会被放入引用队列
- 通过代码遍历引用队列, 将SoftReference的强引用删除
弱引用
弱引用的整体机制和软引用基本一致,区别在于弱引用.
包含的对象在垃圾回收时,不管内存够不够都会直接被回收。在JDK 1.2版之后提供了WeakReference类来实现弱引用,弱引用主要在ThreadLocal中使用。弱引用对象本身也可以使用引用队列进行回收。
虚引用
虚引用也叫幽灵引用/幻影引用,不能通过虚引用对象获取到包含的对象。虚引用唯一的用途是当对象被垃圾回收器回收时可以接收到对应的通知。 Java中使用PhantomReference实现了虚引用,直接内存中为了及时知道直接内存对象不再使用,从而回收内存,使用了虚引用来实现。
垃圾回收算法
Java是如何实现垃圾回收的呢?简单来说,垃圾回收要做的有两件事:
- 找到内存中存活的对象
- 释放不再存活对象的内存,使得程序能再次利用这部分空间
Java垃圾回收过程会通过单独的GC线程来完成,但是不管使用哪一种GC算法,都会有部分阶段需要停止所有的用户线程。这个过程被称之为Stop The World简称STW,如果STW时间过长则会影响用户的使用。
垃圾回收算法评价标准
判断一个GC算法是否优秀,可以从三个方面来考虑:
-
吞吐量
吞吐量指的是CPU用于执行用户代码的时间宇CPU总执行时间的比值,即吞吐量 = 执行用户代码时间 /(执行用户代码时间 + GC时间)。吞吐量数值越高,垃圾回收的效率就越高。
-
最大暂停时间
最大暂停时间指的是所有在垃圾回收过程中的STW时间最大值。比如如下的图中,黄色部分的STW就是最大暂停时间,显而易见上面的图比下面的图拥有更少的最大暂停时间。 最大暂停时间越短,用户使用系统时受到的影响就越短。
-
堆使用效率
不同垃圾回收算法,对堆内存的使用方式是不同的。比如标记清除算法,可以使用完整的堆内存。而复制算法会将堆内存一分为二,每次只能使用一半内存。从堆使用效率上来说,标记清除算法要优于复制算法
上述三种评价标准:堆使用效率、吞吐量,以及最大暂停时间不可兼得。
一般来说,堆内存越大,最大暂停时间就越长。想要减少最大暂停时间,就会降低吞吐量。不同的垃圾回收算法,适用于不同的场景。
标记清除算法
标记清除算法的核心思想分为两个阶段:
1.标记阶段,将所有存活的对象进行标记。 Java中使用可达性分析算法,从GC Root开始通过引用链遍历出所有存活对象。
2.清除阶段,从内存中删除没有被标记也就是非存活对象
标记清除算法优缺点
-
优点:实现简单,只需要在第一阶段给每个存活对象进行标记,第二阶段释放没有标记对象即可
-
缺点:
-
存在内存碎片
内存空间是连续的,所以在对象被释放后,内存中会出现一些空间非常小的可用内存单元,而当新的对象需要的内存较大时就无法进行内存分配了
-
分配速度慢
这些空闲分区需要一个空闲分区链来维护,可能需要遍历到最后才能找到需要分配的内存
-
复制算法
复制算法的核心思想是:
- 准备两块空间From空间和To空间,每次在对象分配阶段,只能使用其中一块空间(From空间)。
- 在垃圾回收GC阶段,将From中存活对象复制到To空间(被GC Root对象引用的对象)。
- 将两块空间的From和To名字互换。
复制算法的优缺点
-
优点:
- 吞吐量高:复制算法只需要遍历一次存活对象复制到To空间即可,比标记-整理算法少了一次遍历的过程
- 不会产生内存碎片:复制算法在复制之后就会将对象按顺序放入To空间中,所以对象以外的区域都是可用空间,不存在碎片化内存空间。
-
缺点:
- 内存使用率低:每次只有一半的内存空间来为创建的对象使用
标记整理算法
标记整理算法也叫标记压缩算法,是对标记清理算法中容易产生内存碎片问题的一种解决方案。
核心思想分为两个阶段:
- 标记阶段,将所有存活的对象进行标记。 Java中使用可达性分析算法,从GC Root开始通过引用链遍历出所有存活对象。
- 整理阶段,将存活对象移动到堆的一端。清理掉存活对象的内存空间。
标记整理算法类似于操作系统中的**“紧凑技术”**,将一些难以利用的空间凑在一起,
就可以让后方空闲出空闲的内存空间。
标记整理算法的优缺点
-
优点:
- 内存使用率高:整个堆内存都可以使用
- 不会产生内存碎片:在整理阶段可以将对象往内存的一侧进行
移动,剩下的空间都是可以分配对象的有效空间
-
缺点:
- 整理阶段的效率不高
分代垃圾回收算法
分代垃圾回收算法(Generational GC),会将上述描述的垃圾回收算法组合进行使用。
分代垃圾回收将整个内存区域划分为年轻代和老年代:
如下图分别为伊甸园、幸存者和老年代。
伊甸园区和幸存者区的比例默认为8,新生代如果是1G内存,伊甸园区为800M,S0和S1各100M
分代回收时,创建出来的对象,首先会被放入Eden伊甸园区。
随着对象在Eden区越来越多,如果Eden区满,新创建的对象已经无法放入,就会触发年轻代的GC,称为Minor GC或者Young GC。
Minor GC会把eden中和From需要回收的对象回收,把没有回收的对象放入To区
接下来, S0会变成To区, S1变成From区。当eden区满时再往里放入对象,依然会发生Minor GC。此时会回收eden区和S1(from)中的对象,并把eden和from区中剩余的对象放入S0。
注意:每次Minor GC中都会为对象记录他的年龄,初始值为0,每次GC完加1
如果Minor GC后对象的年龄达到阈值(最大15,默认值和垃圾回收器有关),对象就会被晋升至老年代。当老年代中空间不足,无法放入新的对象时,先尝试minor gc如果还是不足,就会触发Full GC, Full GC会对整个堆进行垃圾回收。如果Full GC依然无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory异常。
垃圾回收器
**为什么分代GC算法要把堆分成年轻代和老年代? **
系统中的大部分对象,都是创建出来之后很快就不再使用可以被回收,比如用户获取订单数据,订单数据返回给用户之后就可以释放了。
- 老年代中会存放长期存活的对象,比如Spring的大部分bean对象,在程序启动之后就不会被回收了。
- 在虚拟机的默认设置中,新生代大小要远小于老年代的大小。
分代GC算法将堆分成年轻代和老年代主要原因有:
- 可以通过调整年轻代和老年代的比例来适应不同类型的应用程序,提高内存的利用率和性能。
- 新生代和老年代使用不同的垃圾回收算法,新生代一般选择复制算法,老年代可以选择标记-清除和标记-整理算法,由程序员来选择灵活度较高。
- 分代的设计中允许只回收新生代(minorgc),如果能满足对象分配的要求就不需要对整个堆进行回收(fullgc),STW时间就会减少。
由于垃圾回收器分为年轻代和老年代,除了G1之外其他垃圾回收器必须成对组合进行使用。
Serial垃圾回收器
Serial是是一种单线程串行回收年轻代的垃圾回收器。
Serial是回收年轻代的垃圾回收器,SerialOld是Serial垃圾回收器的老年代版
本,都采用单线程串行回收。
-
回收年轻代
-
采用复制算法
-
优点:单CPU处理器下吞吐量非常高
-
缺点:多CPU下吞吐量不如其他垃圾回收器,堆如果偏大会让用户线程处于长时间的等待
-
适用于Java编写的客户端程序或者硬件配置有限的场景
SerialOld垃圾回收器
SerialOld是Serial垃圾回收器的老年代版本,采用单线程串行回收
- 回收老年代
- 采用标记-整理算法
- 优点:单CPU处理器下吞吐量非常出色
- 缺点:多CPU下吞吐量不如其他垃圾回收器,堆如果偏大会让用户线程处于长时间的等待
- 适用场景:与Serial垃圾回收器搭配使用
ParNew垃圾回收器
ParNew垃圾回收器本质上是对Serial在多CPU下的优化,使用多线程进行垃圾回收
-
新生代使用ParNew回收器, 老年代使用串行回收器
-
回收年轻代
-
使用复制算法
-
优点:多CPU处理器下停顿时间较短
-
缺点 :吞吐量和停顿时间不如G1,所以在JDK9之后不建议使用
-
适用场景:JDK8及之前的版本中,与CMS
老年代垃圾回收器搭配使用
CMS 垃圾回收器
CMS(Concurrent Mark Sweep )垃圾回收器关注的是系统的暂停时间,允许用户线程和垃圾回收线程在某些步骤中同时执行,减少了用户线程的等待时间。
- 老年代标记清除算法
- 优点:系统由于垃圾回收出现的停顿时间较短,用户体验好
- 缺点:内存碎片问题、退化问题、浮动垃圾问题
- 适用场景:大型的互联网系统中用户请求数据量大、频率高的场景比如订单接口、商品接口等
CMS执行步骤:
- 初始标记,用极短的时间标记出GC Roots能直接关联到的对象,也就是一步就能到达的对象
- 并发标记, 标记所有的对象,也就是可达对象,用户线程不需要暂停。
- 重新标记,由于并发标记阶段有些对象会发生了变化,存在错标、漏标等情况,需要重新标记。
- 并发清理,清理死亡的对象,用户线程不需要暂停
CMS垃圾回收器存在的问题
- CMS使用了标记-清除算法,在垃圾收集结束之后会出现大量的内存碎片,CMS会在Full GC时进行碎片的整理。这样会导致用户线程暂停
- 无法处理在并发清理过程中产生的“浮动垃圾” ,不能做到完全的垃圾回收,因为在回收的时候程序是并发的运行,就导致有些线程无法及时回收,就只能等到下一次GC再回收。
- 如果老年代内存不足无法分配对象, CMS就会退化成Serial Old单线程回收老年代
**由于CPU的核心数有限,CMS垃圾回收器 就会影响用户线程执行的性能 **
Parallel Scavenge垃圾回收器
Parallel Scavenge是JDK8默认的年轻代垃圾回收器,多线程并行回收,关注的是系统的吞吐量。具备自动调整堆内存大小特点
- 回收年轻代
- 采用复制算法
- 优点:吞吐量高,而且手动可控。为了提高吞吐量,虚拟机会动态调整堆的参数
- 缺点:不能保证单次的停顿时间
- 适用场景:后台任务,不需要与用户交互,并且容易产生大量的对象。比如: 大数据的处理,大文件导出
Parallel Old垃圾回收器
arallel Old是为Parallel Scavenge收集器设计的老年代版本,利用多线程并发收集。
- 回收老年代
- 采用标记-整理算法
- 优点:并发收集,在多核CPU下效率较高
- 缺点:暂停时间会比较长
- 适用场景:与Parallel Scavenge配套使用
Oracle官方建议在使用这个组合时, 不要设置堆内存的最大值,垃圾回收器会根据最大暂停时间和吞吐量自动调整内存大小
G1垃圾回收器
JDK9之后默认的垃圾回收器是G1(Garbage First)垃圾回收器。
Parallel Scavenge关注吞吐量,允许用户设置最大暂停时间 ,但是会减少年轻代可用空间的大小。
CMS关注暂停时间,但是吞吐量方面会下降。
而G1设计目标就是将上述两种垃圾回收器的优点融合:
- 支持巨大的堆空间回收,并有较高的吞吐量。
- 支持多CPU并行垃圾回收。
- 允许用户设置最大暂停时间
G1的整个堆会被划分成多个大小相等的区域,称之为区Region,区域不要求是连续的。分为Eden、 Survivor(幸存者)、Old区。
G1垃圾回收有两种方式:
-
年轻代回收(Young GC)
回收Eden区和Survivor区中不用的对象。会导致STW,
-
混合回收(Mixed GC)
混合回收,既回收年轻代区域又回收老年代区域
G1垃圾回收器 – 执行流程
-
新创建的对象会存放在Eden区。当G1判断年轻代区不足,无法分配对象时需要回收时会执行Young GC
-
标记出Eden和Survivor区域中的存活对象
-
根据配置的最大暂停时间选择某些区域将存活对象复制到一个新的Survivor区中(年龄+1),清空这些区域。G1在进行Young GC的过程中会去记录每次垃圾回收时每个Eden区和Survivor区的平均耗时,以作为下次回收时的参考依据。这样就可以根据配置的最大暂停时间计算出本次回收时最多能回收多少个Region区域了
-
后续Young GC时与之前相同,只不过Survivor区中存活对象会被搬运到另一个Survivor区
-
当某个存活对象的年龄到达阈值(默认15) ,将被放入老年代
-
部分对象如果大小超过Region的一半,会直接放入老年代,这类老年代被称为Humongous区。比如堆内存是4G,每个Region是2M,只要一个大对象超过了1M就被放入Humongous区,如果对象过大会横跨多个Region。
-
多次回收之后,会出现很多Old老年代区,此时总堆占有率达到阈值时
会触发混合回收MixedGC。回收所有年轻代和部分老年代的对象以及大对象区。采用复制算法来完成
混合回收分为:
- 初始标记(initial mark)
- 标记GC Root引用的对象为存活
- 并发标记(concurrent mark)
- 将第一步标记的对象引用对象标记为存活
- 最终标记(remark或者FinalizeMarking)
- 标记一些引用改变漏标的对象,但是并不处理前一个阶段创建的新对象和已经不再使用的对象,会在下一个混合回收来进行处理
- 并发清理(cleanup)
- 将存活对象复制到别的Region,不会产生内存碎片
FULL GC
注意: 如果清理过程中发现没有足够的空Region存放转移的对象,会出现Full GC。单线程执行标记-整理算法,此时会导致用户线程的暂停。所以尽量保证应该用的堆内存有一定多余的空间
G1对老年代的清理会选择存活度最低的区域来进行回收,活跃度最低就是假设有两个区域都有10个对象,区域1有8个存活对象,而区域2只有1个存活对象,G1会优先选择区域2进行回收。
小结
G1垃圾回收器
- 回收年轻代+老年代
- 使用复制算法
- 优点:对比较大的堆如超过6G的堆回收时,延迟可控不会产生内存碎片并发标记的SATB算法效率高
- 缺点:JDK8之前还不够成熟