堆空间的基本结构
Java的自动内存管理主要是针对对象内存的回收和对象内存的分配,Java自动内存管理最核心的功能是堆内存中对象的分配与回收
Java堆是垃圾收集器管理的主要区域,因此也被称作GC堆(Garbage Collected Heap)
从垃圾回收的角度来说,由于现在收集器基本采用分代垃圾收集算法,所以Java堆被划分为几个不同的区域,这样就可以根据各个区域的特点选择合适的垃圾收集算法
JDK1.7及JDK1.7之前,堆内存通常分为三部分:
1.新生代内存(Young Generation)
2.老生代(Old Generation)
3.永久代(Permanent Generation)
Eden区、两个Survivor区S0和S1属于新生代,中间一层属于老年代,最下面一层属于永久代
JDK1.8之后PermGen(永久)被Metaspace(元空间)取代,元空间使用的是直接内存
内存分配和回收原则
对象优先在 Eden 区分配
大多数情况下,对象在新生代中Eden区分配,当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC
测试代码:
public class GCTest {
public static void main(String[] args) {
byte[] allocation1, allocation2;
allocation1 = new byte[30900 * 1024];
}
}
运行:
运行结果:
此时Eden区内存几乎已经被分配完全,即使程序什么也不做,新生代也会使用2000多k内存
再为allocation2分配内存:
allocation2 = new byte[900 * 1024];
运行结果:
给allocation2分配内存时Eden区内存几乎已经被分配完了
当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC,GC期间虚拟机又发现 allocation1无法存入Survivor空间,所以只好通过空间分配担保机制把新生代的对象提前转移到老年代中去,老年代上的空间足够存放allocation1,所以不会进行Full GC
空间分配担保机制:若分配内存时Eden区内存几乎已经被分配完了,而Survivor空间是比较小的,这时需要老年代进行分配担保,把Survivor无法容纳的对象放到老年代,老年代要进行空间分配担保,前提是老年代有足够空间来容纳这些对象,但一共有多少对象在内存回收后存活下来是不可预知的,因此只好取之前每次垃圾回收后晋升到老年代的对象大小的平均值作为参考,使用这个平均值与老年代剩余空间进行比较,来决定是否进行Full GC来让老年代腾出更多空间
执行Minor GC后,后面分配的对象如果能够存在Eden区的话,还是会在Eden区分配内存,可执行如下代码验证:
public class GCTest {
public static void main(String[] args) {
byte[] allocation1, allocation2, allocation3, allocation4, allocation5;
allocation1 = new byte[32000 * 1024];
allocation2 = new byte[1000 * 1024];
allocation3 = new byte[1000 * 1024];
allocation4 = new byte[1000 * 1024];
allocation5 = new byte[1000 * 1024];
}
}
大对象直接进入老年代
大对象:需要大量连续内存空间的对象,例如字符串、数组
大对象直接进入老年代的行为是由虚拟机动态决定的,它与具体使用的垃圾回收器和相关参数有关,大对象直接进入老年代是一种优化策略,旨在避免将大对象放入新生代,从而减少新生代的垃圾回收频率和成本
G1垃圾回收器会根据-XX:G1HeapRegionSize设置的堆区域大小和-XX:G1MixedGCLiveThresholdPercent设置的阈值,来决定哪些对象直接进入老年代
Parallel Scavenge垃圾回收器中,默认情况下,并没有一个固定的阈值(XX:ThresholdTolerance是动态调整的)来决定何时直接在老年代分配大对象,而是由虚拟机根据当前的堆内存情况和历史数据动态决定
长期存活的对象将进入老年代
既然虚拟机采用了分代收集的思想来管理内存,那么内存回收时就必须能识别哪些对象应放在新生代,哪些对象应放在老年代中。为了做到这一点,虚拟机给每个对象一个对象年龄(Age)计数器。
大部分情况,对象都会首先在 Eden 区域分配。如果对象在 Eden 出生并经过第一次 Minor GC 后仍然能够存活,并且能被 Survivor 容纳的话,将被移动到 Survivor 空间(s0 或者 s1)中,并将对象年龄设为 1(Eden 区->Survivor 区后对象的初始年龄变为 1)。
对象在Survivor中每熬过一次MinorGC,年龄增加1岁,当年龄增加到一定程度(默认15岁?),就会晋升到老年代中,对象晋升到老年代的年龄阈值,可通过参数-XX:MaxTenuringThreshold来设置
15岁误区:
1.Hotspot遍历所有对象时,按照年龄从小到大对其所占用的大小进行累积,当累积的某个年龄大小超过了survivor区的50%时(默认值是 50%,可通过-XX:TargetSurvivorRatio=percent设置),取这个年龄和MaxTenuringThreshold中更小的一个值,作为新的晋升年龄阈值
2.参数-XX:MaxTenuringThreshold说明:默认晋升年龄并不都是15,这个要区分垃圾收集器,CMS是6
主要进行gc的区域
针对HotSpot VM的实现,它里面的GC其实准确分类只有两大种:
1.部分收集(Partial GC):
新生代收集(Minor GC/Young GC):只对新生代进行垃圾收集
老年代收集(Major GC/Old GC):只对老年代进行垃圾收集,需要注意的是Major GC在有的语境中也用于指代整堆收集
混合收集(Mixed GC):对整个新生代和部分老年代进行垃圾收集
2.整堆收集(Full GC):收集整个Java堆和方法区
空间分配担保
空间分配担保是为了确保在Minor GC之前老年代本身还有容纳新生代所有对象的剩余空间
《深入理解Java虚拟机》第三章对于空间分配担保的描述:
JDK6 Update24之前,在发生Minor GC前,虚拟机必须先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,若条件成立,此次Minor GC可以确保是安全的,若不成立,则虚拟机会先查看-XX:HandlePromotionFailure参数的设置值是否允许担保失败(Handle Promotion Failure)若允许,则继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,若大于,将尝试进行一次Minor GC(这次Minor GC是有风险的),若小于,或-XX:HandlePromotionFailure设置不允许冒险,那这时要改为进行一次Full GC
JDK6 Update24之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小,就会进行Minor GC,否则将进行Full GC
死亡对象判断方法
堆中几乎放着所有的对象实例,对堆垃圾回收前的第一步就是要判断哪些对象已经死亡(即不能再被任何途径使用的对象)。
引用计数法
给对象中添加一个引用计数器:
1.每当有一个地方引用它,计数器就加1
2.当引用失效,计数器就减1
3.任何时候计数器为0的对象就是不可能再被使用的
这个方法实现简单,效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因是它很难解决对象之间循环引用的问题
对象之间的循环引用问题:除了对象A和B相互引用着对方之外,这两个对象之间再无任何引用,但是他们因为互相引用对方,导致它们的引用计数器都不为0,于是引用计数算法无法通知GC回收器回收它们
可达性分析算法
可达性分析算法的基本思想是通过一系列的称为GC Roots的对象作为起点,从这些节点开始向下搜索,节点所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连的话,则证明此对象是不可用的,需要被回收
下图中的Object 6~Object 10之间虽有引用关系,但它们到GC Roots不可达,因此为需要被回收的对象
哪些对象可以作为GC Roots:
1.虚拟机栈(栈帧中的局部变量表)中引用的对象
2.本地方法栈(Native方法)中引用的对象
3.方法区中类静态属性引用的对象
4.方法区中常量引用的对象
5.所有被同步锁持有的对象
6.JNI(Java Native Interface)引用的对象
对象可以被回收,不代表一定会被回收:
即使在可达性分析法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑阶段”,要真正宣告一个对象死亡,至少要经历两次标记过程
可达性分析法中不可达的对象被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize方法,当对象没有覆盖finalize方法,或finalize方法已经被虚拟机调用过时,虚拟机将这两种情况视为没有必要执行
被判定为需要执行的对象将会被放在一个队列中进行第二次标记,除非这个对象与引用链上的任何一个对象建立关联,否则就会被真的回收
Object类中的finalize方法一直被认为是一个糟糕的设计,成为了Java语言的负担,影响了Java语言的安全和GC的性能,JDK9版本及后续版本中各个类中的finalize方法被逐渐弃用移除
引用类型总结
无论是通过引用计数法判断对象引用数量,还是通过可达性分析算法判断对象的引用链是否可达,判定对象的存活都与引用有关
JDK1.2之前,Java中引用的定义很传统:若reference类型的数据存储的数值代表的是另一块内存的起始地址,就称这块内存代表一个引用
JDK1.2以后,Java对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用、虚引用四种(引用强度逐渐减弱)
强引用(StrongReference)
以前使用的大部分引用实际上都是强引用,这是使用最普遍的引用,若一个对象具有强引用,类似于必不可少的生活用品,垃圾回收器绝不会回收它
当内存空间不足,Java虚拟机宁愿抛出 OutOfMemoryError错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题
软引用(SoftReference)
若一个对象只具有软引用,那就类似于可有可无的生活用品,若内存空间足够,垃圾回收器不会回收它,若内存空间不足了,就会回收这些对象的内存,只要垃圾回收器没有回收它,该对象就可以被程序使用,软引用可用来实现内存敏感的高速缓存
软引用可以和一个引用队列(ReferenceQueue)联合使用,若软引用所引用的对象被垃圾回收,Java虚拟机把这个软引用加入到与之关联的引用队列中
弱引用(WeakReference)
若一个对象只具有弱引用,那就类似于可有可无的生活用品,弱引用与软引用的区别在于只具有弱引用的对象拥有更短暂的生命周期,在垃圾回收器线程扫描它所管辖的内存区域的过程中,一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存,不过,由于垃圾回收器是一个优先级很低的线程,因此不一定会很快发现那些只具有弱引用的对象
弱引用可以和一个引用队列(ReferenceQueue)联合使用,若弱引用所引用的对象被垃圾回收,Java虚拟机就会把这个弱引用加入到与之关联的引用队列中
虚引用(PhantomReference)
顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期,若一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收
虚引用主要用来跟踪对象被垃圾回收的活动
虚引用与软引用和弱引用的一个区别在于虚引用必须和引用队列(ReferenceQueue)联合使用
当垃圾回收器准备回收一个对象时,若发现它还有虚引用,会在回收对象的内存之前,把这个虚引用加入到与之关联的引用队列中,程序可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的对象是否将要被垃圾回收,若程序发现某个虚引用已经被加入到引用队列,那么就可以在所引用的对象的内存被回收之前采取必要的行动
特别注意,在程序设计中一般很少使用弱引用与虚引用,使用软引用的情况较多,这是因为软引用可以加速 JVM 对垃圾内存的回收速度,可以维护系统的运行安全,防止内存溢出(OutOfMemory)等问题的产生
如何判断一个常量是废弃常量
1.JDK1.7之前运行时常量池逻辑包含字符串常量池存放在方法区,此时hotspot虚拟机对方法区的实现为永久代
2.JDK1.7字符串常量池被从方法区拿到了堆中,这里没有提到运行时常量池,即字符串常量池被单独拿到堆,运行时常量池剩下的东西还在方法区,也就是hotspot中的永久代
3.JDK1.8时hotspot移除了永久代用元空间(Metaspace)取而代之,这时字符串常量池还在堆,运行时常量池还在方法区,只不过方法区的实现从永久代变成了元空间(Metaspace)
假如在字符串常量池中存在字符串abc,若当前没有任何String对象引用该字符串常量的话,就说明常量abc是废弃常量,若这时发生内存回收的话而且有必要的话,abc就会被系统清理出常量池
如何判断一个类是无用的类
方法区主要回收的是无用的类,那么如何判断一个类是无用的类
判定一个常量是否是废弃常量比较简单,而要判定一个类是否是无用的类的条件则相对苛刻许多,类需要同时满足下面3个条件才能算是无用的类:
1.该类所有的实例都已经被回收,即Java堆中不存在该类的任何实例
2.加载该类的ClassLoader已经被回收
3.该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法
虚拟机可以对满足上述3个条件的无用类进行回收,这里说的仅仅是可以,而并不是和对象一样不使用了就会必然被回收
垃圾收集算法
标记-清除算法
标记-清除(Mark-and-Sweep)算法分为标记(Mark)和清除(Sweep)阶段:首先标记出所有不需要回收的对象,在标记完成后统一回收掉所有没有被标记的对象
它是最基础的收集算法,后续的算法都是对其不足进行改进得到,这种垃圾收集算法会带来两个明显的问题:
效率问题:标记和清除两个过程效率都不高
空间问题:标记清除后会产生大量不连续的内存碎片
关于具体是标记可回收对象还是不可回收对象,众说纷纭,两种说法其实都没问题,个人更倾向于前者
若按照前者的理解,整个标记-清除过程大致是这样的:
1.当一个对象被创建时,给一个标记位,假设为0(false)
2.在标记阶段,将所有可达对象(或用户可以引用的对象)的标记位设置为1(true)
3.扫描阶段清除的就是标记位为0(false)的对象
标记-复制算法
为了解决标记-清除算法的效率和内存碎片问题,标记-复制(Mark-and-Copying)收集算法出现了,它可以将内存分为大小相同的两块,每次使用其中的一块,当这一块的内存使用完后,就将还存活的对象复制到另一块去,然后再把使用的空间一次清理掉,这样就使每次的内存回收都是对内存区间的一半进行回收
虽然改进了标记-清除算法,但依然存在问题:
可用内存变小:可用内存缩小为原来的一半
不适合老年代:如果存活对象数量比较大,复制性能会变得很差
标记-整理算法
标记-整理(Mark-and-Compact)算法是根据老年代的特点提出的一种标记算法,标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象回收,而是让所有存活的对象向一端移动,然后直接清理掉端边界以外的内存
由于多了整理这一步,因此效率也不高,不过适合老年代这种垃圾回收频率不是很高的场景
分代收集算法
当前虚拟机的垃圾收集都采用分代收集算法,这种算法没有什么新的思想,只是根据对象存活周期的不同将内存分为几块,一般将Java堆分为新生代和老年代,这样就可以根据各个年代的特点选择合适的垃圾收集算法
例如在新生代中,每次收集都会有大量对象死去,所以可以选择标记-复制算法,只需要付出少量对象的复制成本就可以完成每次垃圾收集;而老年代的对象存活几率是比较高的,而且没有额外的空间对它进行分配担保,所以选择标记-清除或标记-整理算法进行垃圾收集
面试题:HotSpot为什么要分为新生代和老年代
垃圾收集器
垃圾收集算法是内存回收的方法论,垃圾收集器是内存回收的具体实现
虽然对各个收集器进行比较,但并非要挑选出一个最好的收集器,因为直到现在为止还没有最好的垃圾收集器出现,更没有万能的垃圾收集器,能做的就是根据具体应用场景选择适合自己的垃圾收集器,若有一种任何场景下都适用的完美收集器存在,那么HotSpot虚拟机就不会实现那么多不同的垃圾收集器了
JDK默认垃圾收集器(使用java -XX:+PrintCommandLineFlags -version命令查看):
JDK8:Parallel Scavenge(新生代)+Parallel Old(老年代)
JDK9~JDK20:G1
Serial收集器
Serial(串行)收集器是最基本、历史最悠久的垃圾收集器,这个收集器是一个单线程收集器,它的单线程的意义不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作,更重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程(Stop The World),直到它收集结束
新生代采用标记-复制算法,老年代采用标记-整理算法
虚拟机的设计者们当然知道Stop The World带来的不良用户体验,所以在后续的垃圾收集器设计中停顿时间在不断缩短(仍然还有停顿,寻找最优秀的垃圾收集器的过程仍然在继续)
但是Serial收集器也有优于其他垃圾收集器的地方,它简单而高效(与其他收集器的单线程相比),Serial收集器由于没有线程交互的开销,可以获得很高的单线程收集效率,Serial收集器对于运行在Client模式下的虚拟机来说是个不错的选择
ParNew收集器
ParNew收集器其实就是Serial收集器的多线程版本,除了使用多线程进行垃圾收集外,其余行为(控制参数、收集算法、回收策略等)和Serial收集器完全一样
新生代采用标记-复制算法,老年代采用标记-整理算法
它是许多运行在Server模式下的虚拟机的首要选择,除了Serial收集器外,只有它能与CMS收集器(真正意义上的并发收集器)配合工作
并行和并发概念补充:
并行(Parallel):多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态
并发(Concurrent):用户线程与垃圾收集线程同时执行(但不一定是并行,可能会交替执行),用户程序在继续运行,而垃圾收集器运行在另一个CPU上
Parallel Scavenge收集器
Parallel Scavenge收集器是使用标记-复制算法的多线程收集器
Parallel Scavenge收集器关注点是吞吐量(高效率的利用 CPU),CMS等垃圾收集器的关注点更多的是用户线程的停顿时间(提高用户体验)
所谓吞吐量就是CPU中用于运行用户代码的时间与CPU总消耗时间的比值,Parallel Scavenge收集器提供了很多参数供用户找到最合适的停顿时间或最大吞吐量,若对于收集器运作不太了解,手工优化存在困难时,使用Parallel Scavenge收集器配合自适应调节策略,把内存管理优化交给虚拟机去完成是一个不错的选择
新生代采用标记-复制算法,老年代采用标记-整理算法
是JDK1.8的默认收集器
使用java -XX:+PrintCommandLineFlags -version命令查看
-XX:InitialHeapSize=262921408 -XX:MaxHeapSize=4206742528 -XX:+PrintCommandLineFlags -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseParallelGC
java version "1.8.0_211"
Java(TM) SE Runtime Environment (build 1.8.0_211-b12)
Java HotSpot(TM) 64-Bit Server VM (build 25.211-b12, mixed mode)
JDK1.8默认使用Parallel Scavenge+Parallel Old,若指定了-XX:+UseParallelGC参数,则默认指定了-XX:+UseParallelOldGC,可以使用-XX:-UseParallelOldGC来禁用该功能
Serial Old收集器
Serial收集器的老年代版本,同样是一个单线程收集器
主要有两大用途:一种用途是在JDK1.5以及以前的版本中与Parallel Scavenge收集器搭配使用,另一种用途是作为CMS收集器的后备方案
Parallel Old收集器
Parallel Scavenge收集器的老年代版本,使用多线程和标记-整理算法
在注重吞吐量以及CPU资源的场合,可以优先考虑Parallel Scavenge收集器和Parallel Old收集器
CMS收集器
CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器,非常符合在注重用户体验的应用上使用
CMS收集器是HotSpot虚拟机第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程(基本上)同时工作
从名字中的Mark Sweep两个词可以看出,CMS收集器是由标记-清除算法实现的,它的运作过程相比于前面几种垃圾收集器来说更加复杂一些
整个过程分为四个步骤:
1.初始标记:暂停所有的其他线程,并记录下直接与root相连的对象,速度很快
2.并发标记:同时开启GC和用户线程,用一个闭包结构去记录可达对象,但在这个阶段结束,这个闭包结构并不能保证包含当前所有的可达对象,因为用户线程可能会不断的更新引用域,所以GC线程无法保证可达性分析的实时性,所以这个算法里会跟踪记录这些发生引用更新的地方
3.重新标记:重新标记阶段是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段的时间稍长,远远比并发标记阶段时间短
4.并发清除:开启用户线程,同时GC线程开始对未标记的区域做清扫
从它的名字就可以看出是一款优秀的垃圾收集器,主要优点:并发收集、低停顿
但是它有下面三个明显的缺点:对CPU资源敏感、无法处理浮动垃圾、它使用的标记-清除算法会导致收集结束时会有大量空间碎片产生
G1收集器
G1(Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器,以极高概率满足GC停顿时间要求的同时,还具备高吞吐量性能特征
被视为JDK1.7中HotSpot虚拟机的一个重要进化特征,它具备以下特点:
1.并行与并发:G1能充分利用CPU、多核环境下的硬件优势,使用多个CPU(CPU或CPU核心)来缩短Stop The World停顿时间,部分其他收集器原本需要停顿Java线程执行的GC动作,G1收集器仍然可以通过并发的方式让Java程序继续执行
2.分代收集:虽然G1不需要其他收集器配合就能独立管理整个GC堆,但还是保留了分代的概念
3.空间整合:与CMS的标记-清除算法不同,G1从整体来看是基于标记-整理算法实现的收集器,从局部上来看是基于标记-复制算法实现的
4.可预测的停顿:这是G1相对于CMS的另一个大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒
G1收集器的运作大致分为以下几个步骤:初始标记、并发标记、最终标记、筛选回收
G1收集器在后台维护了一个优先列表,每次根据允许的收集时间,优先选择回收价值最大的Region(这也就是它的名字Garbage First的由来),这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限时间内尽可能高的收集效率(把内存化整为零)
从JDK9开始,G1垃圾收集器成为默认的垃圾收集器
ZGC收集器
与CMS中的ParNew和G1类似,ZGC也采用标记-复制算法,不过ZGC对该算法做了重大改进
在ZGC中出现Stop The World的情况会更少
Java11的时候 ,ZGC还在试验阶段,经过多个版本的迭代,不断的完善和修复问题,ZGC在 Java15已经可以正式使用了,不过默认的垃圾回收器依然是G1