java虚拟机垃圾回收的算法思想

垃圾回收概念与算法

了解什么是垃圾回收

学习几种常见的垃圾回收算法

理解Stop-The-World(STW)


本文的主要目的是理解垃圾回收算法的思想。java虚拟机具体的垃圾回收机制会在以后的博客中出现。如有不足,敬请批评。


1.了解什么是垃圾回收

   谈到垃圾回收(简称GC) ,需要澄清什么是垃圾。类比日常生活中的垃圾,我们会把它丢到垃圾桶,然后倒掉。GC中的垃圾,特指存在于内存中、不会再被使用的对象,而“回收”,也相当于把垃圾桶“倒掉”。这样内存空间里就会有空闲的区域被腾出来。如果不及时对内存中的垃圾进行清理,那么这些垃圾对象所占的内存空间会一直保留到应用程序结束,被保留的内存空间无法被其他对象使用。如果大量不会被使用的对象一直占着空间不放,需要内存空间时,就无法使用这些被垃圾对象占用的内存,从而导致内存溢出。
   java语言中,我们只需要使用new关键字申请内存空间,而不需要释放内存。因为有java虚拟机的垃圾回收机制,进行垃圾对象的释放。

2.学习几种常见的垃圾回收算法

	 垃圾回收的概念已经有了基本的理解,我们将进一步讨论实现垃圾回收的方法,主要内容是理解java垃圾回收机制的理论基础,将主要讨论:引用计数法、标记压缩法、标记清除法、复制算法和分代分区的思想。
引用计数法
     引用计数法是最经典也是最古老的一种垃圾算法。
     引用计数法的原理是引用计数器,引用计数器的实现:对于一个对象a,只要有任何一个对象引用了a,则a的引用计数器就加1,当引用失效时,引用计数器就减1。只要对象a的引用计数器的值为0,则对象a就不可能再被使用。
     引用计数器只需要为每个对象配备一个整型的计数器即可。但是引用计数器有2个非常严重的问题:
     (1)无法处理循环引用的情况。因此在java的垃圾回收器中,没有使用这种算法。
     (2)引用计数器要求在每次因引用的产生和消除,需要伴随一个加法操作和减法操作,对系统性能会有一定的影响。
     一个简单的循环引用的问题描述如下:有对象A和对象B,对象A中含有对象B的引用,对象B中含有对象A的引用。此时对象A和对象B的引用计数器都不为0。但是在系统中却不存在任何第三个对象引用了A和B。也就是说A和B是应该被回收的垃圾对象,但是由于垃圾对象间的互相引用,从而使垃圾回收机制无法识别,引起内存泄漏。所以java虚拟机并未选择此算法作为垃圾回收算法。
标记清除法
【名次解释】可达对象:指通过根对象进行引用搜索,最终可以达到的对象;不可达对象:指通过根对象进行引用搜索,最终没有被引用的对象。
 标记清除算法是现代垃圾回收算法的基础。标记清除法将垃圾回收分为两个阶段:标记阶段和清除阶段。一种可行的实现是,在标记阶段,首先通过根节点,标记所有从根节点开始的可达对象。因此未被标记的对象就是未被引用的垃圾对象。然后,在清除阶段,清除所有未被标记的对象。标记清除算法可能产生的最大问题就是空间碎片。
 如图4.2所示,使用标记清除算法对一块连续的内存空间进行回收。从根节点开始(这里显示了2个根),所有的有引用关系的对象均被标记为存活对象(箭头表示引用)。从根节点起,不可达对象均为垃圾对象。在标记操作完成后,系统回收所有不可达的空间。

4.2
如图4.2所示,回收后的空间是不连续的。在对象的堆空间分配过程中,尤其是大对象的内存分配,不连续内存空间的工作效率要低于连续的空间。因此这也是该算法的最大缺点。
注意:标记清除算法先通过根节点标记所有可达对象,然后清除所有不可达对象,完成垃圾回收。

复制算法
	复制算法的核心思想:将原有的内存空间分为2块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中的存活的对象复制到未使用的内存中,之后清除正在使用的内存块中的所有对象,交换两个内存的角色,完成垃圾回收。
	如果系统中的垃圾对象很多,复制算法需要复制的存活对象数量就会相对较少。因此,在真正需要垃圾回收的时刻,复制算法的效率时很高的。又由于对象是在垃圾回收过程中,统一被复制到新的内存空间中,因此,可确保回收后的内存空间是没有碎片的。虽然有以上2大优点,但是复制算法的代价却是将系统内存折半,因此单纯的复制算法也很难让人接受。
	如图4.3所示,A、B2块相同的内存空间,A在进行垃圾回收时,将存活的对象复制到B中,B中的空间在复制后保持连续。复制完成后,清空A。并将B空间设置为当前使用空间。

4.3
在java的新生代串行垃圾回收机器中,使用了复制算法的思想。新生代分为e den 空间、from空间和to空间3个部分。其中from空间和to空间可以视为用于复制的两块大小相同、地位相等、且可进行角色互换的空间块。from和to空间也称为survivor空间,即幸存者空间,用于存放未被回收的对象。如图4.4所示。
4.4
【名字解释】
新生代:存放年轻对象的堆空间。年轻对象指刚刚创建的,或者经历垃圾回收次数不多的对象。
老年代:存放老年对象的堆空间。老年对象指经历过多次垃圾回收依然存活的对象。

在垃圾回收时,eden空间中的存活对象会被复制到未使用的survivor空间中(假设时to),正在使用的survivor空间(假设时from)中的年轻对象也会复制到to空间中(大对象,或者老年对象会直接进入老年代,如果to空间已满,则对象也会直接进入老年代)。此时,e den空间和from空间中的剩余对象就是垃圾对象,可以直接清空,to空间则存放此次回收后的存活对象。这种改进的复制算法,既保证了空间的连续性,又避免了大量的内存空间浪费。如图4.4所示,显示了复制算法的实际回收过程。当所有存活对象都复制到survivor区后(图中为to),简单地清空eden区和备用的survivor区(图中为from)即可。
注意:复制算法比较适用于新生代,因为新生代,垃圾对象通常会多于存活对象。复制算法的效果会比较好。

标记压缩法
	复制算法的高效是建立在存活对象少、垃圾对象多的前提下的。这种情况在新生代经常发生,但在老年代,更常见的情况是大部分对象都是存活对象。如果依然使用复制算法,由于存活对象较多,复制的成本也将很高。因此基于老年代垃圾回收的特性,需要使用其他的算法。
	标记压缩法是一种老年代的回收算法。它在标记清除算法的基础上做了一次优化。和标记清除算法一样,标记压缩算法首先需要从根节点开始,对所有可达对象做一次标记。但之后,它并不只是简单地清理为标记的对象,而是将所有存活的对象压缩到内存的一端。之后,清理边界外所有的空间。这种方法**避免了碎片的产生**,**又不需要2块相同的空间,性价比较高**。
	如图4.5所示,在通过根节点标记出所有的可达对象以后,沿虚线进行对象移动,将所有的可达对象都移动到一端,并保持它们之间的引用关系,最后,清理边界外的空间,即可完成回收工作。

4.5

标记压缩算法的最终效果等同于标记清除算法执行完成后,再进行一次内存碎片整理,因此,也可以把它称为标记清除压缩算法。

分代算法
     复制、标记清除、标记压缩等垃圾回收算法,都具有各自独特的优势和特点。一次根据垃圾回收对象的特性,使用合适的算法回收才是明智的选择。
     分代算法就是基于这种思想,它将内存空间根据对象的特点分成几块,根据每块内存空间的特点,使用不同的回收算法,以提高垃圾回收的效率。
     一般来说,java虚拟机会将所有的新建对象都放入新生代的内存区域,新生代的特点是对象朝生夕灭,大约90%的新建对象会被很快回收,因此新生代对象比较适合使用复制算法。当一个对象经过几次回收后依然存活,对象就会被放入老年代内存空间。在老年代中,几乎所有的对象都是经过几次垃圾回收后依然得以存活的。因此,可以认为这些对象在一段时间内,甚至在应用程序的整个生命周期中,将是常驻内存的。所以老年对的回收使用与新生代不同的标记压缩或标记清除算法,以提高垃圾回收效率。
分区算法
     分代算法将按照对象的生命周期长短划分成2个部分,分区算法将整个堆空间划分成连续的不同小区间,每一块区间都独立使用,独立回收。这种算法的好处是可以控制一次回收多少个小区间。
     一般来说,在相同的条件下,堆空间越大,一次GC时所需要的时间就越长,从而产生的停顿也越长。(GC停顿,垃圾回收产生的应用程序停顿)为了更好的控制GC产生的停顿时间,将一块大的内存区域分割成多个小块,根据目标停顿时间,每次合理地回收若干个小区间,而不是整个堆空间,从而减少一次GC所产生的停顿。

垃圾回收时的停顿现象Stop-The-World

	垃圾回收器的任务时识别和回收垃圾对象进行内存清理。为了让垃圾回收器可以正常且高效地执行,大部分情况下,会要求系统进入一个停顿的状态。停顿的目的是终止所有应用线程的执行,只有这样,系统中才不会有新的垃圾产生,同时停顿保证了系统状态在某一个瞬间的一致性,也有益于垃圾回收器更好的标记垃圾对象。因此,在垃圾回收时,都会产生应用程序的停顿。停顿产生时,整个应用程序会被卡死,没有任何响应。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值