《深入理解JVM.2nd》笔记(三):垃圾收集器与垃圾回收策略

概述

1960年诞生于MIT的Lisp是第一门真正使用内存动态分配垃圾收集技术的语言。

当Lisp还在胚胎期,人们就在思考GC需要完成3件事情:

  1. 哪些内存需要回收?
  2. 什么时候回收?
  3. 如何回收?

经过多年发展,垃圾收集器与内存分配技术日臻完善,为什么还有去了解GC和内存分配

因为当需要排查各种内存溢出、内存泄露问题时,当垃圾收集称为系统达到更高并发量的瓶颈时,就需要对这些“自动化”的技术实施必要的监控调节


在Java内存运行时区域中,PCR、 VM Stack、 Native Method Stack 3个区域与线程同生共死

栈中的栈帧随着方法的进入和退出而有条不紊地执行者出栈和入栈的操作。每一栈帧中分配多少内存基本上是在类结构确定下俩就已知的。

因此这几个区域内存分配和回收都具备确定性,所以无需多虑,内存随着方法结束或者线程结束而回收

Java堆 和 方法区与这3区域的不同。

一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,这能在程序运行期间才能知道会创建哪些对象,这部分内存分配和回收都是动态。

GC所关注的是这部分内存。

对象已死吗

GC在堆进行回收前,第一件事就是要哪些对象是“活”的,哪些是“死”的。

引用计数算法

引用计数算法 Reference Counting思路:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器+1;引用失效时,计数器-1;任何时刻计数器为0的对象就是不可能再被使用。

它的优点:简单高效

但是,主流JVM未选用该算法管理内存,其中最主要的原因是它很难解决对象间相互循环引用的问题

两对象相互引用的例子

package com.lun.c03;
/**
 * testGC()方法执行后,objA和objB会不会被GC呢? 
 * @author zzm
 */
public class ReferenceCountingGC {
   
   

	public Object instance = null;

	private static final int _1MB = 1024 * 1024;

	/**
	 * 这个成员属性的唯一意义就是占点内存,以便在能在GC日志中看清楚是否有回收过
	 */
	private byte[] bigSize = new byte[2 * _1MB];

	public static void testGC() {
   
   
		ReferenceCountingGC objA = new ReferenceCountingGC();
		ReferenceCountingGC objB = new ReferenceCountingGC();
		objA.instance = objB;
		objB.instance = objA;

		objA = null;
		objB = null;

		// 假设在这行发生GC,objA和objB是否能被回收?
		System.gc();
	}
}

上例侧面说明VM并不是通过引用计数算法来判断对象是否存活的。

PS. 上例没有main方法,另外程序例子运行后如何生成GC日志暂未说明,GC日志内容也未说明。

PS. 理解GC日志

可达性分析算法

Reachability Analysis/əˈnælɪsɪs/

Java、C#、古老Lisp都是通过这种算法来判断对象是否存活。

算法思路:通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链Reference Chain,当一对象到GC Roots没有任何引用链相连(用图论的话来说,就是从GC Root到这个对象不可达)时,则证明此对象是不可用的。

在Java语言中,可作为GC Roots的对象包括下面几种:

  1. VM Stack(栈帧的本地变量表)中引用的对象
  2. 方法区中类静态属性引用的对象
  3. 方法区中常量引用的对象
  4. 本地方法栈中JNI(即一般说的Native方法)引用的对象

再谈引用

无论是通过引用计数算法判断对象的引用对象,还是通过可达性分析算法判断对象的引用链是否可达,判定对象是否存活都与“引用”有关。

JDK1.2以前,Java中的引用的定义很传统:若reference类型的数据中存储的数字代表的是另一块内存的起始地址,就称这块内存代表着一个引用。这定义纯粹,但狭隘,一个对象在这种顶一下只有被引用或者没有被引用两种状态。

愿景:有一类对象,当内存空间还足够时,则保留在内存中;若内存空间在进行垃圾收集后还是非常紧张,则可抛弃这些对象。很多系统的缓存功能都符合这样的应用场景。

在JDK1.2后,Java对引用的概念进行了扩充。

  1. 强引用StrongReference指在程序代码中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,GC永不回收掉被引用的对象。
  2. 软引用SoftReference用来描述一些还有用但并非必需的对象。 对于软引用关联着的对象,在系统将要发生OOME之前,将会把这些对象列入回收范围之中进行第二次回收。若这次回收还没有足够内存,才会抛出OOME。在JDK1.2后,SoftReference类实现软引用
  3. 弱引用WeakReference用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当GC工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK1.2后,WeakReference类实现弱引用
  4. 虚引用PhantomReference最弱的引用。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被GC回收时收到一个系统通知。在JDK1.2后,PhantomReference类实现虚引用

这4种引用强度依次逐渐减弱。

finalize():生存还是死亡

要真正宣告一个对象死亡,至少要经历两次标记过程:

若对象在进行可达性分析后发现没有与GC Roots相连接引用链,那它会被第一次标记。第一次标记后进行一次筛选,条件是此对象是否有必要执行finalize()方法

VM将两种情况视为“没必要执行”

  • 对象没有覆盖finalize()方法
  • finalize()方法已经被VM调用过

若这对象被判定为有必要执行finalize()方法,这对象就将会防止在一个叫做F-Queue的队列之中,并在稍后由一个由VM自动建立的、低优先级的Finalizer线程去执行它。

这里所谓的“执行”是指VM会触碰这个方法,但并不承诺会等待它运行结束,这样做的原因是,若一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将可能会导致F-ueue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。

finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模标记

自赎的方法:

若对象要在finalize()成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移除出“即将回收”的集合:若对象这时候还没有逃脱,那基本上它就真的被回收了。如下例

package com.lun.c03;

/**
 * 此代码演示了两点: 
 * 1.对象可以在被GC时自我拯救。 
 * 2.这种自救的机会只有一次,因为一个对象的finalize()方法最多只会被系统自动调用一次
 * @author zzm
 */
public class FinalizeEscapeGC {
   
   

	public static FinalizeEscapeGC SAVE_HOOK = null;

	public void isAlive() {
   
   
		System.out.println("yes, i am still alive :)");
	}

	@Override
	protected void finalize() throws Throwable {
   
   
		super.finalize();
		System.out.println("finalize mehtod executed!");
		FinalizeEscapeGC.SAVE_HOOK = this;
	}

	public static void main(String[] args) throws Throwable {
   
   
		SAVE_HOOK = new FinalizeEscapeGC();

		//对象第一次成功拯救自己
		SAVE_HOOK = null;
		System.gc();
		// 因为Finalizer方法优先级很低,暂停0.5秒,以等待它
		Thread.sleep(500);
		if (SAVE_HOOK != null) {
   
   
			SAVE_HOOK.isAlive();
		} else {
   
   
			System.out.println("no, i am dead :(");
		}

		// 下面这段代码与上面的**完全相同**,但是这次自救却失败了
		SAVE_HOOK = null;
		System.gc();
		// 因为Finalizer方法优先级很低,暂停0.5秒,以等待它
		Thread.sleep(500);
		if (SAVE_HOOK != null) {
   
   
			SAVE_HOOK.isAlive();
		} else {
   
   
			System.out.println("no, i am dead :(");
		}
	}
}

/* result:

finalize mehtod executed!
yes, i am still alive :)
no, i am dead :(
*/

上例子中,代码有两段完全一样的代码片段,执行结果却是一次逃脱成功,一次失败,这是因为任何一个对象的finalize()方法都只会被系统自动调用一次,若对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码自救行动失败了。


建议finalize()不要被调用

它不是C/C++中的析构函数,而是Java诞生初期为使C/C++程序员更容易接受它所作出的一个妥协。

它的运行代价高昂,不确定性大,无法保

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值