垃圾收集器及内存分配策略


垃圾收集在java产生之前就有了。垃圾收集要考虑如下三个问题:

  • 哪些内存进行垃圾回收?
  • 什么时候进行垃圾回收?
  • 怎样进行垃圾回收?

哪些内存要进行垃圾回收?

首先java虚拟机栈(栈)、程序计数器、本地方法栈,这三个内存区域随 线程 而生,随 线程 而死,并且每一个栈帧需要分配多少内存空间在类结构确定(类加载)之后就明确了。由于这三个区域的内存分配和回收具有确定性,所以他们的内存回收不需要太多考虑。

然而,堆、方法区内存的分配和回收都是动态的(要分配哪些对象只有在程序运行时才知道),所以 垃圾收集器关注的这这部分内存 ,本章后面所说的内存,指的就是这部分内存。

顺便补充一下,java虚拟机栈(栈)和堆的区别:

  1. 垃圾收集器关注的是堆,而不关注栈
  2. 栈存的是局部变量表、对象的引用、操作数栈、动态链接等,而堆存的是对象的实例

1 对象已死吗(什么时候进行垃圾回收?)


判断对象是否可用有两种方式:引用计数、可达性分析算法。

1.1引用计数


引用计数有一个缺点,那就是循环引用。JavaScript中的引用计数也存在这种问题。并且实际上,主流的虚拟机都采用那个可达性分析算法。

1.2可达性分析算法


思想:从一系列被称为GC Roots的对象开始向下搜索对象,搜索产生的路径称为 引用链 ,当对象和GC Roots之间没有这样的引用链时,证明这个对象不可用。
对象的可达性分析算法
可作为GC Roots的对象如下:

  1. 虚拟机栈中所引用的对象
  2. 方法区中类静态属性引用的对象
  3. 方法区中常量(运行时常量池)所引用的对象
  4. 本地方法栈中(Native方法)所引用的对象

1.3 死还是不死


上面的引用计数和可达性分析算法只能判断对象可用还是不可用,不可用是相当与对对象判了 缓刑。要决定对象死还是不死至少要经历两次标记过程(两次可达性分析):

如果对象进行可达性分析时不存在引用链,它将会被标记一次并进行筛选,筛选的条件是是否有必要执行finalize()方法(当对象已经执行了一次finalize方法或者没有重新finalize方法时,就没必要了),当在finalize()中,对象被拯救了,也就是又被其他引用指向了,那么在第二次标记中它会被移出“即将回收“集合。

注意:finalize()方法只允许被调用一次(只能有gc调用,不要有对象自身调用),并且不要使用finalize,这只是为让C++程序员使用java的一种妥协。

1.4 回收方法区


方法区(永生代)的垃圾收集主要是两部分:废弃常量、无用的类。
判断无用的类的标准:

  1. 该类所有的实例都已经被回收
  2. 加载该类的类加载器(ClassLoader)已经被回收
  3. 该类对应的java.lang.Class对象没有引用指向

2 垃圾收集算法


2.1 标记-清除算法

标记-清除算法存在两点不足:

  1. 标记和清除过程效率不高
  2. 空间问题,清除后可能会产生大量不连续的内存空间

在这里插入图片描述

2.2 复制算法


这个方法适用于对象存活率低的内存空间。

将内存空间分为 两块 ,当一块的内存使用完后,将其中存活的对象移到另一块内存空间中,清空上一块内存空间。缺点是,空间利用率不高。

在这里插入图片描述

研究表明,堆中新生代98%的对象是朝生幕死的,所以将新生代划分为 一个Eden、两个Survivor 。当一个Eden和一个Survivor的内存使用完后,就将其存活对象复制到另一个Survivor中。当然,当另一个Survivor内存不够时,就要使用到堆的老年代了。Hotspot虚拟机默认的Eden和Survior的比例为8:2,也就是只有1/10的空间被浪费了。

不过,我们没办法eden区和1个survivor区间存活下来的对象只有1/10。当存活下来的对象超过了1/10,我们就要使用到老年代了。

2.3 标记-整理算法


这个方法适用于对象存活率高的空间(老年代)

这个方法和标记-清理算法一样,只不过第二个过程整理是将存活的对象往一段移动,然后清空边界以外的内存空间。

标记-整理算法示意图

?:为什么标记整理算符既然都适合了老年代了,为什么不适合新生代。
这是因为标记整理有个整理的过程。我要先判断往那个方向规整,而我们知道内层是一个线性结构,万一这个堆的两头都有需要清理的数据咋办。所以此时需要移动这两头的需要清理的数据。麻烦!还不如复制算符中,给我们提供了一块完全空的内层 ,我们可以放心的存放幸存的对象。

2.4 分代收集算法


这是当前商业虚拟机(如hotspot)采用的垃圾收集算法。

根据对象的生存周期将堆分为新生代,老年代。新生代采用复制算法,老生代采用标记-清理算法或标记-整理算法。

3 hotSpot算法的实现


枚举根节点(GC roots)

由于方法区一般很大,所以需要OOP数据结构来指明哪里有对象引用引用。当然在执行gc时,要保证引用链不能被改变,于是就有了 gc停顿 (中断所以的java线程)

安全点(safe point)

线程执行时,并非让gc可以在程序的任意一个地方进行gc停顿。只有到达安全点(指令复用,方法调用,循环跳转,异常跳转)才能进行gc停顿。

到达安全点,进行gc停顿的方式有两种:枪先式中断、主动时中断

安全区域(safe range)

当线程发生阻塞时,它是不会响应中断的。因此,我就让阻塞时间内执行的代码区域称为 安全区域 。当发生gc停顿时,gc是不管把自己标记为Safe range 状态的线程的。当线程要离开safe range状态时,要先判断gc过程(枚举根节点)是否已经完成,总之直到gc过程完成后,线程才可以从阻塞状态继续执行。

4 垃圾收集器


如果说内存收集算法是内存回收的方法论,那么垃圾收集器就是内存的具体实现。下面图上有连线的表示可用配合使用。
在这里插入图片描述

4.1 Serial收集器


Serial收集器只会使用一个cpu或一条收集线程区进行垃圾回收。并且在它进行垃圾回收时,必须暂停所有工作线程,直到它结束。

在这里插入图片描述

优点是:简单高效。

4.2 ParNew收集器


可以说它是Serial收集器的多线程版本,除了使用多线程进行垃圾回收之外,其余的控制行为、垃圾收集算法、对象分配规则都和Serial收集器一样。
在这里插入图片描述

4.3 Parallel Scavenge收集器


Parallel Scavenge收集器是多线程的,采用复制算法的新生代收集器。它关注的是尽可能让程序的吞吐量(运行用户代码时间/(运行用户代码时间+垃圾收集时间))大。所以这个收集器适合用于在后台运行的与用户交互少任务。可以设置-XX:UseAdaptiveSizePolizy来开启GC自适应收集策略(它会提供一个最好的吞吐量,并且这个是它与ParNew的一个重要区别)。

4.4 Serial Old 收集器


它是一个Serial收集器的老年代版本。采用的是标记-整理算法。
在这里插入图片描述

4.5 Parallel Old 收集器


它是Parallel Scavenge收集器的老年代版本。使用多线程和“标记-整理算法”。
在这里插入图片描述

4.6 CMS收集器


CMS收集器是一种获得最短停顿时间的收集器。它分为如下4个步骤:

  1. 初始标记:初始标记和重新标记都需要暂停所有工作任务。初始标记仅仅只标记GC Roots直接关联的对象。
  2. 并发标记:进行GC Roots tracing的过程。
  3. 重新标记:用于标记并发标记期间,由于用户程序继续运作而导致的标记变动的那一部分对象。
  4. 并发清除:清除对象

从总体来说,CMS的内存回收过程是与用户线程一起执行的。

在这里插入图片描述

CMS收集器的优点:并发收集、低停顿。
CMS收集器的缺点:对内存空间比较敏感、会产生大量空间碎片、无法收集浮动垃圾。

4.7 G1收集器


它是一款面向服务器端的收集器。与其他GC收集器相比,有如下特点:

  1. 并发并行
  2. 分代收集
  3. 空间整合(标记-清理算法)
  4. 停顿时间可预测

它有四个步骤:初始标记、并发标记、最终标记、筛选回收。
在这里插入图片描述


5 内存分配与垃圾回收策略

java体系的自动内存管理最终可以归纳为完成了两个问题:给对象分配内存以及回收分配给对象的内存。对象内存分配,往大方向讲是往堆上分配,对象主要分配在新生代的Eden区上。
规则一:对象优先在Eden区分配

大多数情况下,对象在新生代Eden区中分配。当Eden区空间不足时虚拟机将发送一次Minor GC1.

规则二:大对象直接进入老年代

所谓大对象就是那种需要大量连续内存空间的Java对象。比如那种很长的字符串以及数组。

规则三:长期存活的对象将进入老年代

虚拟机给每个对象定义了一个对象年龄(Age)计数器。对象没熬过一次Minor GC,年龄就增加1。当它的年龄增加到一定程度(可以设置),就可以移到老年代。

规则四:动态对象年龄判断

如果Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,那么年龄大于或等于该年龄的对象就可以直接进入老年代,无需等待达到MaxTenuringThreshold中要求的年龄。

规则五:内存空间担保

在发送Minor GC时,系统会判断老年代中最大的连续内存空间是否大于新时代所有对象空间,若大于,那么这次Minor GC是安全的。若不允许,就会检查HandlePromotionFailure设置值是否允许担保失败。如果允许,就会检查历次新生代晋升的对象平均值是否小于老年代中最大连续内存空间,满足要就,就进行一次Minor GC(有风险)。如果不满足要求或者不允许担保失败,这时就要进行FULL GC。


  1. Minor GC(新生代GC):发生在新生代的垃圾收集动作。一般比较频繁。
    Full GC/Major GC(老年代GC):发生在老年代的垃圾收集动作。速度一般会比Minor GC 慢上10倍。 ↩︎

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值