垃圾收集器与内存分配策略

最新推荐文章于 2024-10-05 23:06:03 发布

johnzeng2

最新推荐文章于 2024-10-05 23:06:03 发布

阅读量92

点赞数

文章标签： jvm java 虚拟机

本文链接：https://blog.csdn.net/johnzeng2/article/details/84529869

版权

java内存运行时区域的各个部分中，程序计数器、JVM栈、本地方法栈这三个区域随线程而生，随线程而灭，栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的，因此这几个区域的内存分配和回收都具备确定性，在这几个区域内不需要过多考虑内存回收的问题，因为方法结束或线程结束时，内存自然就随着回收了。而java堆和方法区则不一样，一个接口中的多个实现类需要的内存可能不一样，一个方法中的多个分支需要的内存也可能不一样，我们只有在程序处于运行期间时才能知道会创建哪些对象，这部分内存的分配和回收都是动态的。

一、判定对象已经死亡的算法
1. 引用计数算法（Reference Counting）
给每个对象添加一个引用计数器，当有一个地方引用它时，计数器值就加1；当引用失效时，计数器值就减1；任何时刻计数器都为0的对象就是不可能再被引用的。实际上，java语言并没有选用引用计数算法来管理内存，其中最主要的原因是它很难解决对象之间的相互循环引用的问题

2. 根搜索算法（CG Roots Tracing）
在主流的商用程序语言中，都是使用根搜索算法判定对象是否存活的。这个算法的基本思路就是通过一系列的名为“GC Roots”的对象作为起始点，从这些节点开始向下搜索，搜索所走过的路径称为引用链（Reference Chain），当一个对象到GC Roots之间没有任何引用链相连（用图论的话来说就是从GC Roots到这个对象不可达）时，则证明此对象是不可用的。在java语言中，可作为GC Roots的对象包括下面几种：
（1）JVM栈（栈帧中的本地变量表）中引用的对象
（2）方法区中的类静态属性引用的对象
（3）方法区中的常量引用的对象
（4）本地方法栈中JNI（即一般说的native方法）引用的对象

二、引用的类型
1. 强引用（Strong Reference）
强引用就是指在程序代码之中普遍存在的，类似“Object obj = new Object()”这类的引用都是强引用，只要强引用还存在，GC永远不会回收掉那些被引用的对象
2. 软引用（Soft Reference）
软引用用来描述一些还有用，但并非必须的对象。对于软引用关联着的对象，在系统将要发生内存溢出异常之前，将会把这些对象列进回收范围之内并进行第二次回收。如果这次回收还是没有足够的内存，才会抛出内存溢出异常。在JDK1.2之后，提供了SoftReference类来实现软引用。
3. 弱引用（Weak Reference）
弱引用也是用来描述非必须对象的，但是它的强度比软引用更弱一些，被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当GC工作时，无论当前内存是否足够，都会回收掉只被弱引用关联的对象。在JDK1.2之后，提供了WeakReference类来实现弱引用
4. 虚引用（Phantom Reference）
虚引用也称为幽灵引用或者幻影引用，它是最弱的一种引用关系。一个对象是否有虚引用的存在，完全不会对其生存时间构成影响，也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被GC回收时收到一个系统通知。在JDK1.2之后，提供了PhantomeReference类来实现虚引用。

三、垃圾收集算法
1. 标记-清除算法（Mark-Sweep）

顾名思义，该算法分为“标记”和“清除”两个阶段：首先标记出所有需要回收的对象，在标记完成后统一回收掉所有被标记的对象。它的主要缺点有两个：
（1）效率问题
标记和清除过程的效率都不高
（2）空间问题
标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导致，当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
2. 复制算法（copying）

该算法将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。该算法实现简单，运行高效。但是代价有点高，需要将内存缩小为原来的一半。现在的商业虚拟机都采用该收集算法来回收新生代。IBM的专门研究表明，新生代的对象98%都是朝生夕死的，所以并不需要按照1:1的比例来划分内存空间，而是将内存分为一块较大的Eden空间和两块较小的Survivor空间，每次使用Eden和其中的一块Survivor。当回收时，将Eden和Survivor中还存活着的对象一次性拷贝到另外一块Survivor空间上。HotSpot VM默认的Eden和Survivor的大小比例是8:1，即每次新生代中可用内存为整个新生代容量的90%（80%+10%）。当Survivor空间不够用时，需要依赖其他内存（这里指老年代）进行分配担保，如果另外一块Survivor空间没有足够的空间存放上一次新生代收集下来的存活对象，那么这些对象将直接通过分配担保机制进入老年代。该算法的缺点是：在对象存活率较高时，就要执行较多的复制操作，效率将会变低。
3. 标记整理算法（Mark-Compact）

由于复制算法针对对象存活率较高的场景时所表现出来的低效问题，老年代需要使用另外一种算法，即标记-整理算法。标记过程仍然与“标记-清除”算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存
4. 分代收集算法（Generational Collection）
该算法根据对象存活周期的不同将内存划分为几块，一般是把java堆分为新生代（可细分为一个Eden区和两个Survivor区）和老年代。新生代中，每次垃圾收集时都发现有大批对象死去，只有少量存活，那就选用复制算法，只需要付出少量存活对象的复制成本就可以完成收集。下图展示了新生代内存回收（minor GC）的执行过程：

而老年代中因为对象存活率高、没有额外空间对它进行分配担保，就必须使用“标记-清理”或“标记-整理”算法来进行回收。

四、垃圾收集器
对于新生代和老年代，JVM可使用很多种垃圾收集器器进行垃圾收集，下图展示了几款不同的垃圾收集器，其中两个收集器之间有连线表示这两个收集器可以同时使用。

而这些垃圾收集器又可分为串行收集方式、并行收集方式以及并发收集方式执行，分别运用于不同的场景，如下图所示：

1. Serial收集器
该收集器是一个单线程的收集器，在它进行GC时，必须暂停其他所有的工作线程（Stop the world），直到它收集结束。实际上到目前为止，它仍然是JVM运行在Client模式下的默认新生代收集器。在用户的桌面应用场景中，分配给JVM管理的内存一般来说不会很大，收集几十兆甚至一两百兆的新生代，停顿时间完全可以控制在几十毫秒最多一百多毫秒以内，因此只要不是频繁发生，那么这点停顿是可以接受的。因此，Serial收集器对于运行在Client模式下的JVM来说是一个很好的选择

2. ParNew收集器
ParNew收集器其实就是Serial收集器的多线程版本。它是许多运行在Server模式下的JVM中首选的新生代收集器，除了Serial收集器外，目前只有它能与CMS收集器配合工作。ParNew收集器在单CPU的环境中绝对不会比Serial收集器有更好的效果，甚至由于存在线程交互的开销，该收集器在通过超线程技术实现的两个CPU的环境中都不能百分百保证能超越Serial收集器。

3. Parallel Scavenge收集器
与CMS等收集器的关注点不同，Parallel Scavenge收集器的目标是达到一个可控制的吞吐量，而非尽可能地缩短垃圾收集时用户线程的停顿时间。该收集器还包含一个GC自适应的调节策略（GC Ergonomics），该策略也是Parallel Scavenge收集器与ParNew收集器的一个重要区别。

4. Serial Old收集器
Serial Old是Serial收集器的老年代版本，它同样是一个单线程收集器，使用“标记-整理”算法。这个收集器的主要意义也是被Client模式下的JVM使用。

5. Parallel Old收集器
Parallel Old是Parallel Scavenge收集器的老年代版本，使用多线程和“标记-整理”算法。直到Parallel Old收集器出现后，“吞吐量优先”收集器才终于有了比较名副其实的应用组合，在注重吞吐量及CPU资源敏感的场合，都可以优先考虑Parallel Scavenge加Parallel Old收集器。

6. CMS收集器（Concurrent Mark Sweep）
CMS收集器是一种以获取最短回收停顿时间为目标的收集器。CMS收集器是基于“标记-清除”算法实现的，整个过程分为四个步骤：
（1）初始标记（CMS initial mark）
仅仅只是标记一下GC Roots能直接关联到的对象，速度很快
（2）并发标记（CMS concurrent mark）
进行GC Roots Tracing的过程
（3）重新标记（CMS remark）
为了修正并发标记期间，因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录
（4）并发清除（CMS concurrent sweep）

由于整个过程中耗时最长的并发标记和并发清除过程中，收集器线程都可以与用户线程一起工作，所以总体上来说，CMS收集器的内存回收过程是与用户线程一起并发执行的。
CMS是一款优秀的收集器，优缺点如下：
（1）优点
并发收集、低停顿
（2）缺点
a. CMS收集器对CPU资源非常敏感
b. CMS收集器无法处理浮动垃圾（Floating Garbage）
c. CMS是一款基于“标记-清除”算法实现的垃圾收集器，意味着收集结束时会产生大量空间碎片。空间碎片过多时，将会给大对象分配带来很大的麻烦，往往会出现老年代还有很大的空间剩余，但是无法找到足够大的连续空间来分配当前对象，从而不得不提前触发一次Full GC。
7. G1收集器（Garbage First）
与CMS相比有两个显著的改进：
（1）G1收集器是基于“标记-整理”算法实现的
（2）可以非常精确地控制停顿
G1将整个Java堆（包括新生代和老年代）划分为多个大小固定的独立区域（Region），并且跟踪这些区域里面的垃圾堆积程度，在后台维护一个优先列表，每次根据允许的收集时间，优先回收垃圾最多的区域（Garbage First名称的由来）。区域划分及有优先级的区域回收，保证了G1收集器在有限的时间内可以获得最高的收集效率

五、内存分配与回收策略
java体系中所提倡的自动内存管理最终可以归结为自动化地解决两个问题：对象内存分配和对象内存回收
1. 对象优先在Eden分配