垃圾收集器与内存分配策略

垃圾收集(Garbage Collection,GC)

GC需要完成的3件事情
  1. 哪些内存需要回收?
  2. 什么时候回收?
  3. 如何回收?

为什么我们需要了解GC和内存分配?
当需要排查各种内存溢出、内存泄露问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就需要对这些”自动化“的技术实施必要的监控和调节。

哪些内存需要回收呢?
java运行时数据区:程序计数器、虚拟机栈、本地方法区、方法区、堆
其中程序计数器、虚拟机栈、本地方法区这3个区域随线程而生,随线程而灭。这几个区域的内存分配和回收具有确定性,这几个区域内就不需要过多考虑回收的问题。
java堆、方法区是线程共享的,我们只有在程序处于运行期间才能知道会创建哪些对象,这部分内存的分配和回收都是动态的。

怎样确定哪些对象”活着“,哪些对象已经”死去“?
  • 引用计数算法(Reference Counting)
判断对象是否存活的算法:给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就会加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
缺陷:它很难解决对象之间相互循环引用的问题(两个对象相互引用这对方,导致它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们)。主流的虚拟机里面没有选用“引用计数算法”来管理内存。

  • 可达性分析算法
在主流的商用程序语言中,都是称通过 可达性分析(Reachhability Analysis)来判断对象是否存活的
算法的基本思想:通过一系列的称为“ GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为 引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时( 不可达),则证明此对象是不可用的。
在java语言中,可作为GC Roots对象包括下面几种:
  1. 虚拟机栈(栈帧中的本地变量表)中引用的对象
  2. 方法区中类静态属性引用的对象
  3. 方法区中常量引用的对象
  4. 本地方法栈中JNI(Native方法)引用的对象

引用
判断对象是否存活都与“引用”有关。
几种引用类型:
  • 强引用:指在程序代码中普遍存在的,类似“Object obj=new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象
  • 软引用:用来描述一些还有用但并非必要的对象。在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。
  • 弱引用:用来描述非必须对象的,但是它的强度比软引用更弱一点,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
  • 虚引用:也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能再这个对象被收集器回收时收到一个系统通知。

生存还是死亡
即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡, 至少要经历两次标记过程:如果对象在进行可达性分析后没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。
如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中。finalize()方法时对象逃脱死亡命运的最后一次机会。
一个对象的finalize()方法最多只会被系统自动调用一次

回收方法区
java虚拟机规范中说过可以不要求虚拟机在方法区实现垃圾收集,而且在方法区进行垃圾收集的“性价比”一般比较低。在堆中,尤其在新生代中,常规应用进行一次垃圾收集一般可以回收70%~95%的空间,而永久代的垃圾收集效率远低于此。
新生代
永久代(垃圾收集的主要内容:废弃常量和无用的类)


垃圾收集算法
  • 标记-清除算法(Mark-Sweep)
分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
缺点:一个是 效率问题;一个是 空间问题
  • 复制算法
为了 解决效率问题,有了 复制(Copying)的收集算法。将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块中,然后再把已使用过的内存空间一次清理掉。
缺点:将内存缩小为了原来的一半。在对象存活率较高时就要进行较多的复制操作,效率将会变低
现在的商业虚拟机都采用这种收集算法来回收新生代。将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和使用过的Survivor空间。
当Survivor空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)
  • 标记-整理算法(Mark-Compact)
复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。所有在老年代一般不能直接选用这种算法。
根据老年代的特点,有人提出了另外一种“标记-整理”算法,首先标记出所有需要回收的对象,然后让存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
  • 分代收集算法
当前商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法。根据对象存活周期的不同将内存划分为几块。 一般把java堆分为新生代和老年代。这样可以根据各个年代的特点采用最合适的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法。老年代中因为对象的存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法。

垃圾收集器(是内存回收的具体实现)
  • Serial收集器
最基本的收集器,它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。
运行在Client模式下的虚拟机来说是一个很好的选择。
  • ParNew收集器
ParNew收集器是Serial收集器的多线程版本。
它是许多运行在Server模式下的虚拟机中首选的新生代收集器

并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态
并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行,而垃圾收集程序运行与另外一个CPU上。
  • Parallel Scavenge收集器
是一个新生代收集器,使用复制算法的收集器,又是多线程收集器。
关注的目标是达到一个可控制的吞吐量(Throughput)——CPU用于运行用户代码的时间与CPU总消耗时间的比值。
吞吐量优先收集器
自适应调节策略也是Parallel Scavenge收集器与ParNew收集器的一种重要区别
  • Serial Old收集器
是Serial收集器的老年代版本,是一个单线程收集器,使用“标记-整理算法”。
  • Parallel Old收集器
是Parallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法
  • CMS收集器(Concurrent Mark Sweep)
是一种以获取 最短回收停顿时间为目标的收集器。基于“标记-清除”算法实现的。
步骤:
  1. 初始标记
  2. 并发标记
  3. 重新标记
  4. 并发清除

  • G1收集器(Garbage-First)
面向服务端应用的垃圾收集器。
特点:
  1. 并行与并发
  2. 分代收集
  3. 空间整合
  4. 可预测停顿
步骤:
  1. 初始标记
  2. 并发标记
  3. 最终标记
  4. 筛选回收


内存分配与回收策略
对象分配内存,往大方向讲,就是在堆上分配内存。对象主要分配在新生代的Eden区上。
  • 对象优先在Eden分配
大多数情况下,对象在新生代Eden区中分配。当Eden区中没有足够的空间进行分配时,虚拟机将发起一次Minor GC。
新生代GC(Minor GC):指发生在新生代的垃圾收集动作,因为java对象大多都具备朝生夕灭的特性,所以Minor GC非常频繁,一般回收速度也比较快。
老年代GC(Major GC/Full GC):指发生在老年代的GC,出现了Major GC,经常会伴随至少一次Minor GC,速度一般比Minor GC慢10倍以上。
  • 大对象直接进入老年代
所谓大对象是指需要大量连续内存空间的java对象,最典型的大对象就是那种很长的字符串以及数组。大对象对虚拟机内存分配来说是一个坏消息。虚拟机提供了一个-XX:PretenureSizeThreshold参数,令大于这个设置值的对象直接在老年代分配。目的是避免在Eden区以及两个Survivor区之间发生大量的内存复制。
  • 长期存活的对象将进入老年代
虚拟机给每个对象定义一个对象年龄(Age)计数器,如果对象在Eden出生并经过第一个Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象的年龄设为1。对象在Survivor区中每“熬过”一次Minor GC,年龄就会增加1岁,当它的年龄增加到一定程度(默认15岁),就将被晋升到老年代中。
  • 动态对象年龄判定
为了能更好地适应不同程序的内存情况,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代。
  • 空间分配担保
在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次Minor GC,尽管这次Minor GC是有风险的;如果小于,或者HandlePromotionFailure设置不允许冒险,那这时也要改为进行一次Full GC.
JDK6之后的规则变成只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor GC,否则将进行Full GC
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值