JVM垃圾收集机制

垃圾收集(Garbage Collection GC)是java虚拟机重要的内存处理机制,实际在内存回收过程中主要涉及到三个方法的问题:1)哪些内存需要回收;2)什么时候进行回收;3)如何进行回收;下面主要围绕这几个问题对GC进行详细描述。

哪些地方的内存需要回收?

对于java内存的各个部分,其中线程私有的部分(虚拟机栈,本地方法栈,程序计数器)与线程的生死相随,这几个区域的内存分配与回收都具有确定性,在方法或者线程结束后,内存自然就会被回收释放了,而对于线程共享部分(堆,方法区),不同的接口或者方法分配可能不同,而且只有在运行期才能确定创建哪些对象,为哪些对象分配内存,因此该部分内存的分配和回收都是动态的,而JVM的垃圾回收主要是这部分内存。

对于方法区或者是HotSpot虚拟机中的老年代,垃圾回收器主要回收废弃变量和无用的类,对于变量的回收与对象的回收方法类似,及该变量没有在被使用;而对于类的回收至少需要满足以下几个条件:

    1.该类的所有实例都已经被回收,即java堆中不存在任何该类的实例;

    2.加载该类的ClassLoader已经被回收;

    3.该类对应的java,lang.Class对象没有在任何地方被使用,且无法在任何地方通过反射访问该类的方法;

什么时候进行回收?

JVM是对内存中”死去”的对象进行回收,但在回收之前,首先要确定对象的”生死”,怎么确定生死呢?目前常见的有:引用计数算法和可达性分析算法。

引用计数算法:给对象添加一个引用计数器,当该对象被引用时,引用计数器加一,当该引用失效时,引用计数器减一,如果对象的引用计数器为零,表示该对象不在被使用;该算法的优点是实现简单,效率较高,但目前的常用的jvm中并没有使用,原因是很难解决对象之间相互循环引用的问题;

可达性分析算法:该算法的基本思想是通过一系列的”GC Roots”的对象作为起始点,从这些节点依次向下搜索,其走过的路径称为引用链,如果某个对象到”GC Roots”之间没有任何的引用链,那么就可以认为该对象就是不可用的;

可以作为”GC Roots”的对象可以是:

1)虚拟机栈中的引用的对象;2)本地方法栈中本地方法引用的对象;3)方法区中常量引用的对象;4)方法区中静态属性引用的对象;

在该算法中不可达的对象一定是非死不可么?实际判断一个对象真正死亡,至少需要两次标记:1)如果系统发现对象时不可达的,则根据是否需要执行finalize()方法来进行第一次标记,如果没有覆盖finalize()方法或者已经被调用过,则不会进行二次标记,对象会被回收;2)如果有必要执行finalize()方法,则对象会被放置到F-Quence队列中,然后由虚拟机创建一个低优先的线程去处理,如果此时对象重新获得引用,则可以逃脱被回收;

无论是引用计数算法或者是可达性分析算法也好,都是需要判断对象的引用,在JDK1.2后,java对引用的概念也进行扩充,将引用分为:强引用,软引用,弱引用,虚引用

1. 强引用:类似Object aa = new Object() 这类的引用就是强引用,只要强引用存在,对象就不会被垃圾回收器回收;

2. 软引用:表示有些用但是不必要的对象,当系统发生内存溢出之前,需要会对这些对象进行二次回收,如果回收后内存还是不够,则抛出内存溢出异常,对应SoftReference类;

3. 弱引用:表示非必要的对象,被弱引用引用的对象只能生存到下一次垃圾回收之前,无论内存够不够,都需要被回收,对应WeakReference类;

4. 虚引用:是最弱的一种引用形式,其不会对对象的生存时间构成任何影响,而且也不能通过虚引用获取对象的实例,其存在的唯一目的是在对象被回收后能够收到一个系统通知,对应PhantomReference类;

如何进行回收?

在上一部分中对对象回收的部分标准算法进行了说明,但在JVM中垃圾回收主要包含垃圾回收算法和垃圾收集器两部分,目前常见的垃圾回收算法包括:标记-清除算法,标记-整理算法,复制算法,分代回收算法;这些算法就是内存回收的方法论,而垃圾回收器就是内存回收的具体实现,java虚拟机并没有对垃圾回收器的实现进行规定,因此不同厂家一般是提供参数供用户自己选择收集器,对于JDK1.7后的HotSpot虚拟机,其包含的虚拟机主要有:Serial收集器,ParNew收集器,Parallel Scavenge收集器,CMS收集器,Serial Old收集器,Parallel Old收集器,G1收集器,下面对各种收集算法和收集器进行详细说明。

垃圾回收算法---标记清除算法:该算法过程分为标记和清除两部分,首先在内存中对需要回收的对象的进行标记,其标记方法一般采用可达性分析算法,在标记完成后在对标记的对象进行统一回收,这是一种最基本的收集算法,其主要存在两个不足:1)效率不高,标记和清除两个过程效率都不高;2)在标记清除后内存中会生成大量的内存碎片,如果碎片过多会导致以后分配较大内存空间时,因无法找到足够的内存在触发垃圾回收过程;

垃圾回收算法--标记整理算法:该算法与标记清除算法类似,只是在标记后并不是直接清除对象,而且让存活的对象移向内存的一端,然后清除掉边界以外的其它内存;

垃圾回收算法--复制算法:为解决标记清除算法的效率问题,出现了一种复制算法,其是将内存按容量划分为大小相等的两块,每次只使用其中的一块,当一块内存使用完后,将内存中存活的对象复制到另一块内存中,然后清除掉使用的内存。通过该算法清除后的内存,不存在内存碎片的问题,而且简单,运行高效,但是需要空闲一半的内存;

垃圾回收算法--分代回收算法:当前商业虚拟机中均使用该算法,其基本思想是java堆分为新生代和老年代两部分,对于新生代中的对象一般都是朝生夕死,只有少量对象存活,通常采用复制算法,而对于老年代中对象因为对象存活率高,而且没有额外空间进行担保,通常采用标记-清理或者标记-整理算法进行回收;

垃圾收集器---新生代内存收集器

1.  Serial收集器:该收集器是最基本的垃圾收集器,其是单线程的,即其只会使用一个cpu或者一条收集线程去进行垃圾回收操作,而且在进行操作时,其它线程需暂停工作,直到该线程收集结束;如果暂停时间过长会严重影响用户体验,但该种垃圾收集器因为其简单高效(对比于其它收集器的单线程),对于单个cpu来说不存在线程的交互开销,因此其依然是虚拟机在Client模式下默认的新生代垃圾收集器;

                                     

2. PartNew收集器:该收集器是Serial收集器的多线程版本,对比于Serila收集器,除了采用多线程外,其余收集算法,控制参数或者回收策略等都与Serila收集器相同,虽然没有太多创新,但其是许多运行在Server模式下虚拟机首选的收集器,原因是除Serila收集器外,它是唯一能与老年代CMS收集器配合使用的收集器;

3.  Parallel Scavenge收集器:其采用复制回收算法,采用并行(并行:Parallel只多条垃圾回收线程进行并行工作,但工作线程扔处于等待状态;并发:Concurrent 指用户线程和垃圾回收线程同时运行,但不一定是并行可能交替运行,用户线程继续运行,而垃圾回收线程在另外一个Cpu上运行)多线程的方式进行垃圾回收,该收集器关注的点是达到一个可控制的吞吐量(等于=运行用户代码的时间/(运行用户代码时间+垃圾收集时间)),高吞吐量可以高效利用CPU资源,适合后台运算而不是太多交互的任务中,控制吞吐量的参数有:最大垃圾收集停顿时间(--XX:MaxGCPauseMillis)和吞吐量大小(--XX:GCTimeRatio),除此之外,使用自适应大小策略(--XX:UseAdaotiveSizePolicy)参数时,就不需要指定新生代的大小,Eden与Survivor区的比例,以及老年代对象大大小等参数,虚拟机会根据系统运行状况来自适应调节;

垃圾收集器---老年代内存收集器

1.  Serial-Old收集器:该收集器是Serial收集器的老年代版本,同样也是单线程的,使用标记-整理算法,主要在Client模式下使用;

2.  Pallel Old收集器:该收集器是Pallel Scavenage收集器的来年版本,采用多线程和标记整理算法;

3.  CMS(Concurrent Mark Sweep)收集器:采用标记清除算法,其是以最短回收停顿时间为目标的收集器,希望系统停顿时间最短,提高用户体验,其收集过程大约包含四部分:初始标记(标记下GC Roots能直接关联到的对象);并发标记(进行GC Roots 追踪的过程);重新标记(修正因用户程序继续运行导致的标记错误);并发清除;虽然停顿时间短,但是缺点主要包括1:因其占用部分线程来进行垃圾回收操作会导致吞吐量较低,对CPU资源比较敏感;2:因为用户线程的继续运行,导致部分垃圾在标记过程之后产生,而这些垃圾只能在下次GC处理,因此无法处理这样的浮动垃圾;3.因为采用标记清除算法,导致内存中产生大量的内存碎片;

对于GC,除了垃圾回收算法和采用的垃圾收集器外,对于内存的分配与回收,虚拟机中也存在需要不同的规则:

1. 对象优先在Eden区分配:大多数情况下,对象在新生代Eden中分配,当没有足够的空间时候,需要进行一次Minor GC(发生在新生代的垃圾回收操作,比较频繁且速度快)

2. 大对象直接进行老年代:这里的大对象是指需要大量连续内存空间的java对象,如长字符串以及数组等;虚拟机提供--XX:PretenureSizeThrend参数,大于该设置的对象直接进入老年代分配,避免在Eden和Survivor区进行大量内存复制操作;

3. 长期存活的对象进入老年代:对于每个对象都有一个年龄计数器,对于新生代Survivor区中的对象每熬过依次MinorGC,年龄加一,当增加到一定程度(默认15,使用参数--XX:MaxTenuringThreshold),则进行老年代存储;

4. 对象年龄的动态判断:在虚拟机中并不是只有对象达到参数设定的年龄才可以进行老年代,对于Survivor区中相同年龄所有对象大学的总和大于Survivor空间的一半时,大于该年龄的对象可以直接进行老年代;

5. 空间分配担保策略:在发生Minor GC之前,虚拟机会检查老年代中最大可用的连续内存是否大于新生代所有对象的总空间,如果满足,则这次Minor GC就是安全的,如果不满足,则需要检查HandelPromotionFailure 设置是否允许担保失败,如果允许,则检查老年代最大连续可用内存是否大于历代晋升老年代对象的平均大小,如果大于,则尝试进行Minor GC,如果小于或者是不允许担保失败,则进行Full GC(发生在老年代中的GC,速度一般比Minor GC慢10倍以上);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值