虚拟机(JVM)垃圾(GC)收集,带着这3个问题,清晰好记

哪些内存需要回收?

什么时候回收?

如何回收?

 

哪些内存需要回收?

       程序计数器,虚拟机栈,本地方法栈,这3类内存区域线程私有,线程结束后内存则被回收,而Java堆和方法区中的一个接口或抽象类有多种不同的实现需要的内存也不同,方法中的各分支需要的内存也会不同,这些只有在程序运行是才能确定,这部分的内存的分配和回收是动态的,垃圾回收主要关注的是这些区域。

什么时候回收?

引用计数法:给对象添加一个引用计数器,对象每被使用一次,计数器加一,当引用失效时,计数器减一,当计数器的值为0时表示该对象没有被引用,即可以回收。但程序中会存在对象间相互引用而导致计数器无法清零,导致对象无法被回收。

可达性分析算法:通过虚拟机栈中引用的对象,方法区中静态属性引用的对象,方法区中常量引用的对象,本地方法栈中引用的对象,这些被称为GC Roots的对象作为七十点,向下搜索,当某个对象无法通过GC Roots搜索到时,则这个对象称为不可达,也称为引用链不存在。引用的概念细分为4种:强引用,软引用,弱引用,虚引用。强引用类似于 Object obj = new Object(),只要强引用还在,则永远不会被回收;软引用用来描述一些还有用但是非必须的对象,这些对象不会被立即回收,但是会被标记,当一次回收之后内存还不够用时,则在二次回收时将之回收;弱引用也是用来描述非必须对象,但是只能生存一个垃圾回收周期,在下次回收时,不管内存是否够用,都会将之回收;虚引用唯一的作用就是在这个对象被回收时收到一个系统通知。

       上面讲述了Java队中对象的回收判断条件,而方法区的垃圾回收主要集中在两部分:废弃的常量和无用的类。废弃常量的回收和堆中对象的回收非常类似,当没有引用时即可回收,而类的回收需要满足3个条件:该类所有的实例都已被回收,就是说Java堆中没有该类的任何实例;加载该类的ClassLoad对象已被回收,该类对应的java.lang.class对象不存在任何引用,在任何地方都无法通过反射访问该类的方法。

如何回收?

标记清除算法:原理比较简单上文已经提到。缺点有二,意识标记和清楚的效率不高,而是会产生空间碎片,当需要一整块大的区域时,很容易再次出发GC。

复制算法:将内存分为一块较大的Eden空间,和两块较小的Survivor空间,每次只是用Eden空间和一个Survivor,在回收时,将还存活的对象复制到另一个未使用的Survivor空间,清理Eden和刚才使用的Survivor空间,但是,当Survivor空间不足时,需要其他的内存空间作为分配担保(一般指老年代),而且,当对象存活率较高时,会存在较多的复制操作,降低效率。

标记整理算法:通过标记来清除,然后将存活的对象移动到一端,将端边界之外的内存全部清理掉,达到整理的目的;

分代收集算法:在新生代中因为存活率较低所以使用复制算法,而在老年代中存活率较高,没有足够额外空间作为分配担保,所以使用标记整理或者标记清楚算法。

G1垃圾收集器

具有如下特点:

  1. 并行与并发,G1能够利用多CPU,多核环境下的硬件优势,使用多个CPU来缩短 Stop-The-World的时间
  2. 分代收集,区分老年代和新生代的收集算法
  3. 空间整合,从整体上看时基于标记整理算法的收集器,从局部上看是基于复制算法的收集器,这两种算法都意味着不会产生空间碎片。
  4. 可预测停顿,能让使用者明确指定在M毫秒时间段内,垃圾回收的时间不超过N毫秒,这几乎是实时Java垃圾回收的特征了(RTSJ)

GC log日志

       日志没有太多技术含量,只要知道规则,就能看懂,用几个例子大致学习下。

最前面的数字“33.125:”和“100.667:”代表了GC发生的时间,这个数字的含义是从Java虚拟机启动以来经过的秒数。GC日志开头的“[GC”和“[Full GC”说明了这次垃圾收集的停顿类型,而不是用来区分新生代GC还是老年代GC的。如果有“Full”,说明这次GC是发生了Stop-The-World的,例如下面这段新生代收集器ParNew的日志也会出现“[Full GC”(这一般是因为出现了分配担保失败之类的问题,所以才导致STW)。如果是调用System.gc()方法所触发的收集,那么在这里将显示“[Full GC (System)”。

接下来的“[DefNew”、“[Tenured”、“[Perm”表示GC发生的区域,这里显示的区域名称与使用的GC收集器是密切相关的,例如上面样例所使用的Serial收集器中的新生代名为“Default New Generation”,所以显示的是“[DefNew”。如果是ParNew收集器,新生代名称就会变为“[ParNew”,意为“Parallel New Generation”。如果采用Parallel Scavenge收集器,那它配套的新生代称为“PSYoungGen”,老年代和永久代同理,名称也是由收集器决定的。后面方括号内部的“3324K->152K(3712K)”含义是“GC前该内存区域已使用容量-> GC后该内存区域已使用容量 (该内存区域总容量)”。而在方括号之外的“3324K->152K(11904K)”表示“GC前Java堆已使用容量->GC后Java堆已使用容量(Java堆总容量)”。再往后,“0.0025925 secs”表示该内存区域GC所占用的时间,单位是秒。有的收集器会给出更具体的时间数据,如“[Times:user=0.01 sys=0.00,real=0.02 secs]”,这里面的user、sys和real与Linux的time命令所输出的时间含义一致,分别代表用户态消耗的CPU时间、内核态消耗的CPU事件和操作从开始到结束所经过的墙钟时间(Wall Clock Time)。CPU时间与墙钟时间的区别是,墙钟时间包括各种非运算的等待耗时,例如等待磁盘I/O、等待线程阻塞,而CPU时间不包括这些耗时,但当系统有多CPU或者多核的话,多线程操作会叠加这些CPU时间,所以读者看到user或sys时间超过real时间是完全正常的。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值