一,引用
无论是通过引用计数法判断对象引用数量,还是通过可达性分析法判断对象的引用链是否可达,判定对 象的存活都与“
引用
”
有关。
JDK1.2
之前,
Java
中引用的定义很传统:如果
reference
类型的数据存储的数值代表的是另一块内存的 起始地址,就称这块内存代表一个引用。
JDK1.2
以后,
Java
对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用、虚引用四种(引用 强度逐渐减弱)
1.强引用(StrongReference)
以前我们使用的大部分引用实际上都是强引用,这是使用最普遍的引用。如果一个对象具有强引用,那就类似于必不可少的生活用品
,垃圾回收器绝不会回收它。当内存空间不足,
Java
虚拟机宁愿抛出 OutOfMemoryError 错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题。
2.软引用(SoftReference)
如果一个对象只具有软引用,那就类似于
可有可无的生活用品
。如果内存空间足够,垃圾回收器就不会 回收它,如果内存空间不足了,就会回收这些对象的内存。只要垃圾回收器没有回收它,该对象就可以 被程序使用。软引用可用来实现内存敏感的高速缓存。
软引用可以和一个引用队列(
ReferenceQueue
)联合使用,如果软引用所引用的对象被垃圾回收,JAVA 虚拟机就会把这个软引用加入到与之关联的引用队列中。
3.弱引用(WeakReference)
如果一个对象只具有弱引用,那就类似于
可有可无的生活用品
。弱引用与软引用的区别在于:只具有弱 引用的对象拥有更短暂的生命周期。在垃圾回收器线程扫描它所管辖的内存区域的过程中,一旦发现了 只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。不过,由于垃圾回收器是一个 优先级很低的线程, 因此不一定会很快发现那些只具有弱引用的对象。
弱引用可以和一个引用队列(
ReferenceQueue
)联合使用,如果弱引用所引用的对象被垃圾回收,Java 虚拟机就会把这个弱引用加入到与之关联的引用队列中。
4.虚引用(PhantomReference)
"
虚引用
"
顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期。如果 一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收。
虚引用主要用来跟踪对象被垃圾回收的活动
。
虚引用与软引用和弱引用的一个区别在于:
虚引用必须和引用队列(
ReferenceQueue
)联合使用。当 垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象的内存之前,把这个虚引用 加入到与之关联的引用队列中。程序可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的 对象是否将要被垃圾回收。程序如果发现某个虚引用已经被加入到引用队列,那么就可以在所引用的对 象的内存被回收之前采取必要的行动。
特别注意,在程序设计中一般很少使用弱引用与虚引用,使用软引用的情况较多,这是因为
软引用可以
加速
JVM
对垃圾内存的回收速度,可以维护系统的运行安全,防止内存溢出(
OutOfMemory
)等问
题的产生
。
二,垃圾回收算法
2.1 标记-清除算法
该算法分为
“
标记
”
和
“
清除
”
阶段:首先标记出所有不需要回收的对象,在标记完成后统一回收掉所有没有 被标记的对象。它是最基础的收集算法,后续的算法都是对其不足进行改进得到。这种垃圾收集算法会 带来两个明显的问题:
1.
效率问题
2.
空间问题(标记清除后会产生大量不连续的碎片)
2.2 标记-复制算法
为了解决效率问题,
“
标记
-
复制
”
收集算法出现了。它可以将内存分为大小相同的两块,每次使用其中的 一块。当这一块的内存使用完后,就将还存活的对象复制到另一块去,然后再把使用的空间一次清理 掉。这样就使每次的内存回收都是对内存区间的一半进行回收。
2.3 标记-整理算法
根据老年代的特点提出的一种标记算法,标记过程仍然与
“
标记
-
清除
”
算法一样,但后续步骤不是直接对 可回收对象回收,而是让所有存活的对象向一端移动,然后直接清理掉端边界以外的内存。
2.4 分代收集算法
当前虚拟机的垃圾收集都采用分代收集算法,这种算法没有什么新的思想,只是根据对象存活周期的不 同将内存分为几块。一般将 java
堆分为新生代和老年代,这样我们就可以根据各个年代的特点选择合适 的垃圾收集算法。
比如在新生代中,每次收集都会有大量对象死去,所以可以选择
”
标记
-
复制
“
算法,只需要付出少量对象
的复制成本就可以完成每次垃圾收集。而老年代的对象存活几率是比较高的,而且没有额外的空间对它
进行分配担保,所以我们必须选择
“
标记
-
清除
”
或
“
标记
-
整理
”
算法进行垃圾收集。
三,垃圾收集器
如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。
虽然我们对各个收集器进行比较,但并非要挑选出一个最好的收集器。因为直到现在为止还没有最好的 垃圾收集器出现,更加没有万能的垃圾收集器,我们能做的就是根据具体应用场景选择适合自己的垃圾
收集器
。
试想一下:如果有一种四海之内、任何场景下都适用的完美收集器存在,那么我们的
HotSpot 虚拟机就不会实现那么多不同的垃圾收集器了。
3.1 Serial 收集器
Serial
(串行)收集器是最基本、历史最悠久的垃圾收集器了。大家看名字就知道这个收集器是一个单线 程收集器了。它的 “
单线程
”
的意义不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作,更 重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程( "Stop The World"
),直到它 收集结束。
新生代采用标记
-
复制算法,老年代采用标记
-
整理算法。
虚拟机的设计者们当然知道
Stop The World
带来的不良用户体验,所以在后续的垃圾收集器设计中停 顿时间在不断缩短(仍然还有停顿,寻找最优秀的垃圾收集器的过程仍然在继续)。
但是
Serial
收集器有没有优于其他垃圾收集器的地方呢?当然有,它
简单而高效(与其他收集器的单线
程相比)
。
Serial
收集器由于没有线程交互的开销,自然可以获得很高的单线程收集效率。
Serial
收集 器对于运行在 Client
模式下的虚拟机来说是个不错的选择。
3.2 ParNew 收集器
ParNew
收集器其实就是
Serial
收集器的多线程版本,除了使用多线程进行垃圾收集外,其余行为(控
制参数、收集算法、回收策略等等)和
Serial
收集器完全一样。
新生代采用标记
-
复制算法,老年代采用标记
-
整理算法。
它是许多运行在
Server
模式下的虚拟机的首要选择,除了
Serial
收集器外,只有它能与
CMS
收集器 (真正意义上的并发收集器,后面会介绍到)配合工作。
并行和并发概念补充:
并行(
Parallel
)
:指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。
并发(
Concurrent
)
:指用户线程与垃圾收集线程同时执行(但不一定是并行,可能会交替执
行),用户程序在继续运行,而垃圾收集器运行在另一个
CPU
上。
3.3 Parallel Scavenge 收集器
Parallel Scavenge
收集器关注点是吞吐量(高效率的利用
CPU
)。
CMS
等垃圾收集器的关注点更多
的是用户线程的停顿时间(提高用户体验)。所谓吞吐量就是
CPU
中用于运行用户代码的时间与
CPU
总消耗时间的比值。
Parallel Scavenge
收集器提供了很多参数供用户找到最合适的停顿时间或最大吞吐 量,如果对于收集器运作不太了解,手工优化存在困难的时候,使用 Parallel Scavenge
收集器配合自适 应调节策略,把内存管理优化交给虚拟机去完成也是一个不错的选择。
新生代采用标记
-
复制算法,老年代采用标记
-
整理算法。
3.4.Serial Old 收集器
Serial
收集器的老年代版本
,它同样是一个单线程收集器。它主要有两大用途:一种用途是在
JDK1.5
以 及以前的版本中与 Parallel Scavenge
收集器搭配使用,另一种用途是作为
CMS
收集器的后备方案。
3.5 Parallel Old 收集器
Parallel Scavenge
收集器的老年代版本
。使用多线程和
“
标记
-
整理
”
算法。在注重吞吐量以及
CPU
资源 的场合,都可以优先考虑 Parallel Scavenge
收集器和
Parallel Old
收集器。
3.6 CMS 收集器
CMS
(
Concurrent Mark Sweep
)收集器是一种以获取最短回收停顿时间为目标的收集器。它非常符
合在注重用户体验的应用上使用。
CMS
(
Concurrent Mark Sweep
)收集器是
HotSpot
虚拟机第一款真正意义上的并发收集器,它第
一次实现了让垃圾收集线程与用户线程(基本上)同时工作。 从名字中的Mark Sweep
这两个词可以看出,
CMS
收集器是一种
“
标记
-
清除
”
算法
实现的,它的运作过 程相比于前面几种垃圾收集器来说更加复杂一些。整个过程分为四个步骤:
初始标记:
暂停所有的其他线程,并记录下直接与
root
相连的对象,速度很快 ;
并发标记:
同时开启
GC
和用户线程,用一个闭包结构去记录可达对象。但在这个阶段结束,这个 闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域,所以 GC 线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
重新标记:
重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的 那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段的时间稍长,远远比并发标 记阶段时间短
并发清除:
开启用户线程,同时
GC
线程开始对未标记的区域做清扫。
从它的名字就可以看出它是一款优秀的垃圾收集器,主要优点:
并发收集、低停顿
。但是它有下面三个 明显的缺点:
对
CPU
资源敏感;
无法处理浮动垃圾;
它使用的回收算法
-“
标记
-
清除
”
算法会导致收集结束时会有大量空间碎片产生.
3.7 G1 收集器
G1 (Garbage-First)
是一款面向服务器的垃圾收集器
,
主要针对配备多颗处理器及大容量内存的机器
.
以
极高概率满足
GC
停顿时间要求的同时
,
还具备高吞吐量性能特征
. 被视为 JDK1.7
中
HotSpot
虚拟机的一个重要进化特征。它具备一下特点:
并行与并发
:
G1
能充分利用
CPU
、多核环境下的硬件优势,使用多个
CPU
(
CPU
或者
CPU
核
心)来缩短
Stop-The-World
停顿时间。部分其他收集器原本需要停顿
Java
线程执行的
GC
动作,
G1
收集器仍然可以通过并发的方式让
java
程序继续执行。
分代收集
:虽然
G1
可以不需要其他收集器配合就能独立管理整个
GC
堆,但是还是保留了分代的
概念。
空间整合
:与
CMS
的
“
标记
-
清理
”
算法不同,
G1
从整体来看是基于
“
标记
-
整理
”
算法实现的收集器; 从局部上来看是基于“
标记
-
复制
”
算法实现的。
可预测的停顿
:这是
G1
相对于
CMS
的另一个大优势,降低停顿时间是
G1
和
CMS
共同的关注
点,但
G1
除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度
为
M
毫秒的时间片段内。
G1
收集器的运作大致分为以下几个步骤:
初始标记
并发标记
最终标记
筛选回收
G1
收集器在后台维护了一个优先列表,每次根据允许的收集时间,优先选择回收价值最大的
Region(
这
也就是它的名字
Garbage-First
的由来
)
。这种使用
Region
划分内存空间以及有优先级的区域回收方 式,保证了 G1
收集器在有限时间内可以尽可能高的收集效率(把内存化整为零)。
3.8 ZGC
收集器
与
CMS
中的
ParNew
和
G1
类似,
ZGC
也采用标记
-
复制算法,不过
ZGC
对该算法做了重大改进。 在 ZGC
中出现
Stop The World
的情况会更少!
参考
《深入理解
Java
虚拟机:
JVM
高级特性与最佳实践(第二版》