1.如何判断对象可以被回收
对中几乎放着所有的对象实例,堆垃圾回收前的第一步就是要判断那些对象已经死亡(即不能在被任何途径使用的对象)。
1.1引用计数法
给对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1;当引用失败,计数器就减1;任何时候计数器为0的对象就是不可能在被使用的。
**这个方法实现简单、效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因使它很难解决对象之间的相互循环引用的问题。**所谓对象之间的相互引用问题。如下面代码所示:除了对象objA和objB相互引用着对方之外,这两个对象之间再无任何引用。但因为他们因为互相引用对方,导致它们的引用计数器都不为0,于是引用计数算法无法通知GC回收器回收他们。
public class ReferenceCountingGc {
Object instance = null;
public static void main(String[] args) {
ReferenceCountingGc objA = new ReferenceCountingGc();
ReferenceCountingGc objB = new ReferenceCountingGc();
objA.instance = objB;
objB.instance = objA;
objA = null;
objB = null;
}
}
1.2 可达性分析
这个算法的基本思路就是通过一系列的成为“GC Roots”的对象作为起点,从这些节点开始向下搜所,节点所走过的路径成为引用链,当一个对象到GC Roots 没有任何引用链相连的话,证明此对象为不可用的。
GC Roots根节点:类加载器、Thread、虚拟机栈的本地变量表、static成员、常量引用、本地方法栈的变量等等。
1.3 finalize()方法最终判定对象是否存活
即使再可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象的死亡,至少要经历再次标记的过程。
标记的前提是对象再进行可达性分析后发现没有与GC Roots相连接的引用链。
1.第一次标记并进行一次筛选。
筛选的条件是此对象是否有必要执行finalize()方法。
当对象没有覆盖finalize方法,或者finalize方法已经被虚拟机调用过,虚拟机将这两种情况都被宣告“死刑”的对象将会被回收;
2.第二次标记
如果这个对象被判定有必要执行finalize()方法,那么这个对象将会放置再一个名为:F-Queue的队列中,并在稍后由一条虚拟机自动建立的、低优先级的Finalize线程去执行(这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束。这样做的原因是,如果以一个对象finalize()方法中执行缓慢,或者发生死循环(更极端的情况),将很可能导致F-Queue队列中的其他对象永久处于等待状态,甚至导致整个内存回收系统崩溃)。
finalize()方法四对象逃脱死亡命运的最后一次机会,稍后 GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中拯救自己–只要重新于引用链上的任何的一个对象建立关联即可,譬如把自己复制给某个类变量或对象的成员变量,那么在第二次标记时它将移除出“即将回收”的集合,否则将会被回收。
测试代码如下:
public class User {
public String name;
public String sex;
public int id;
public User(String name, String sex, int id) {
this.name = name;
this.sex = sex;
this.id = id;
}
public User(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getSex() {
return sex;
}
public void setSex(String sex) {
this.sex = sex;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
@Override
protected void finalize() throws Throwable {
System.out.println("id为"+id+"的user被回收");
}
public class TestGCFinalize {
public static void main(String[] args) {
List<Object> exitUser = new LinkedList<>();
int i = 0;
int j = 0;
while(true){
exitUser.add(new User(i++));
new User(j--);
}
}
}
1.4 如何判断一个常量是废弃常量
运行时常量池主要回收的是废弃的常量。假如在常量池中存在字符串“abc”,如果当前没有任何String对象引用该字符串常量的话,就说明常量“abc”就是废弃常量,如果这时候发生内存回收的话而且有必要的话,“abc”就会被系统清理出常量池。
1.5 如何判断一个类是无用的类
方法区主要回收的是无用的类,判定一个类是否是“无用的类”需满足以下三个条件:
-
该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例
-
加载该类的ClassLoader已经被回收
-
该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问到该类的方
虚拟机可以对满足上述3个条件的无用类进行回收,这里说的是“可以”,而并不是和对象一样不使用了必然会被回收。
2.垃圾收集算法
2.1 标记清除算法
算法分为“标记”和“清除”两个阶段:首先会标记出所有的需要回收的对象,在标记完成后统一回收所有被标记的对象。
问题:
- 效率问题
- 空间问题(标记清除之后存在大量的不连续碎片)
2.2 复制算法
为了解决效率问题,“复制”收集算法出现了,它可以将内存分为大小相同的两块,每次使用其中的一块。当这一块的内存使用完之后,就将还存活的对象复制到另一块去,然后再把使用的空间一次清理掉,这样使每次的内存回收都是对内存区间的一半进行回收,适用于Survivor区。
2.3 标记-整理算法
根据老年代的特点特出的一种标记算法,标记过程仍然与“标记清除”算法一样,但后续步骤不是直接对可回收对象回收,而是让所有存活的对象向一端移动,然后直接清除掉端边界以外的内存。
2.4 分代收集算法
当代虚拟机的垃圾收集都采取分代收集算法,这种算法没有新的思想,只是根据对象存活周期的不同将内存分为几块,一般将Java堆分为新生代和老年代,这样我们就可以根据各个年代的特点选择合适的垃圾收集算法。
比如在新生代种,每次收集都会有大量对象死去,所以可以选择复制算法,只需要付出少量的复制成本就可以完成每次垃圾收集。而老年代的对象存活几率是比较高的,而且没有额外的空间对他进行分配担保,所以我们必须选择“标记—清除”或者“标记—整理”算法进行垃圾收集
3 垃圾收集器
如果说垃圾收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。
我们能做的就是根据应用场景选择适合自己的垃圾收集器。
3.1 Serial收集器
Serial(串行)收集器是最基本的、历史最悠久的垃圾收集器,单线程收集器。它的“单线程”的意义不仅仅意味着他只会使用一条垃圾收集线程去完成垃圾收集工作,更重要的是它在进行垃圾收集工作的时候必须暂停其他所有工作线程(“stop the world”),直到它收集结束。
shi新生代使用复制算法,老年代采用标记-整理算法
但是Serial收集器简单高效(与其他收集器的单线程相比)
3.2 ParNew收集器
ParNew收集器其实就是Serial收集器的多线程版本,除了使用多线程进行垃圾收集外,其余行为(控制参数、收集算法、回收策略等等)和Serial收集器完全一样。
shi新生代使用复制算法,老年代采用标记-整理算法
他是许多运行在Server模式下的虚拟机的首要选择,除了Serial收集器外,只有他能与CMS收集器(真正意义上的并发收集器,后面会介绍到)配合工作。
3.3 Parallel Scavenge收集器
Parallel Scavenge收集器类似于ParNew收集器,是Server模式(内存大于2G,2个cpu)下的默认收集器。(jdk 8 默认收集器)
**Parallel Scavenge收集器关注电视吞吐量(高效率的利用CPU)。CMS等垃圾收集器的关注点更多的使用户线程的停顿时间(提高用户体验)—>(降低stw时间)。所谓吞吐量就是CPU中用于运行用户代码的时间与CPU总消耗时间的比值。**Parallel Scavenge收集器提供了很多参数供用户找到最合适的停顿时间或者最大吞吐量,如果对于收集器运作不太了解的话,可以选择把内存管理优化交给虚拟机去完成也是一个不错的选择。
新生代使用复制算法,老年代采用标记-整理算法
3.4 Serial Old 收集器
Serial收集器的老年代版本,单线程收集器。
用途:
- 在JDK1.5以及以前版本中的与Parallel Scavenge收集器搭配使用。
- 另一种用途作为CMS收集器的后备方案。
3.5 Parallel Old收集器
Parallel Scavenge收集器的老年代版本。使用多线程和“标记-整理”算法。在注重吞吐量以及CPU资源的场合,都可以优先考虑Parallel Scavenge收集器和Parallel Old收集器。
3.6 CMS收集器(-XX:+UseConcMarkSweepGC(主要是old区使用))
CMS (Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。它而非常符合在注重用户体验的应用上使用,它是HotSpot虚拟机第一款真正意义 的并发收集器,它第一次实现了让垃圾收集线程与用户线程(基本上)同时工作。
从名字中的Mark Sweep这两个词可以看出,CMS收集器是-种“标记-清除” 算法实现的,它的运作过程相比于前面几种垃圾收集器来说更加复杂一些。 整个过程分为四个步骤:
-
初始标记: 暂停所有的其他线程(STW), 并记录下直接与root相连的对象,速度很快;
-
并发标记:同时开启GC和用户线程,用一个闭包结构去记录可达对象。但在这个阶段结束,这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域,所以GC线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
-
重新标记: 重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间般会比初始标记阶段的时间稍长,远远比并发标记阶段时间短
-
并发清除: 开启用户线程,同时GC线程开始对未标记的区域做清扫。
主要优点:并发收集、低停顿。
缺点:
- 对CPU资源敏感(会和服务抢资源)
- 无法处理浮动垃圾(在Java业务程序与垃圾收集线程并发执行过程中产生的垃圾,这种浮动垃圾只能等到下一次GC再清理了)。
- 它使用的回收算法“标记-清除”算法会导致收集结束后产生大量的空间碎片。
3.7 G1收集器(-XX:+UseG1GC)
G1 (Garbage First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足GC停顿时间要求的同时,还具备高吞吐量性能特征。
G1将Java堆划分为多个大小相等的独立区域(Region) ,虽保留新生代和老年代的概念,但不再是物理隔阂了,它们都是(可以不连续) Region的集合。分配大对象(直接进Humongous区,专门存放短期巨型对象,不用直接进老年代,避免Full GC的大量开销)不会因为无法找到连续空间而提前触发下一次GC。
被视为JDK1.7中HotSpot虚拟机的一个重要进化特征。它具备以下特点:
-
并行与并发:G1能充分利用CPU、多核环境下的硬件优势,使用多个CPU (CPU或者CPU核心)来缩短Stop-The-World停顿时间。部分其他收集器原本需要停顿Java线程来执行GC动作,G1收集器仍然可以通过并发的方式让java程序继续执行。
-
分代收集:虽然G1可以不需要其他收集器配合就能独立管理整个GC堆,但是还是保留了分代的概念。
-
空间整合: 与CMS的“标记–清理"算法不同,G1从整体来看是基于“标记整理”算法实现的收集器;从局部上来看是基于“复制”算法实现的。
-
可预测的停顿:这是G1相对于CMS的另一个大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内完成垃圾收集。
G1收集器的运作大致分为以下几个步骤:
-
初始标记(initial mark, STW) :在此阶段,G1 GC对根进行标记。该阶段与常规的(STW)年轻代垃圾回收密切相关。
-
并发标记(Concurrent Marking) : G1 GC在整个堆中查找可访问的(存活的)对象。
-
最终标记(Remark, STW) :该阶段是STW回收,帮助完成标记周期。
-
筛选回收(Cleanup, STW) :筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划,这个阶段其实也可以做到与用户程序-起并发执行, 但是因为只回收-部分Region, 时间是用户可控制的,而且停顿用户线程将大幅提高收集效率。
G1收集器在后台维护了一个优先列表,人每次根据允许的收集时间,优先选择回收价值最大Region(这也就是它的名字Garbage-First的由来)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了GF收集器在有限时间内可以尽可能高的收集效率。