【java笔记】JVM(java虚拟机)之垃圾收集与内存分配策略

1. 垃圾收集与内存分配策略

垃圾收集(Garbage Collection,GC),其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生,随线程而灭,当方法结束或者线程结束时,内存自然就跟随着回收了。而Java堆和方法区这两个区域则有着很显著的不确定性,这部分内存的分配和回收是动态的。垃圾收集器所关注的正是这部分内存该如何管理。

(1) 判断对象是否已死

在堆里面存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象之中哪些还“存活”着,哪些已经“死去”

  • 引用计数算法:在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。原理简单,判定效率高,但需要额外的内存空间,因很难解决对象之间的相互循环引用的问题,此时引用计数器永远不为 0,导致无法对它们进行回收,因此主流的Java虚拟机都没有选用该方法来管理内存
  • 可达性分析算法:通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”,如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的

(2) 引用类型

将引用分为强引用、软引用、弱引用和虚引用4种,这4种引用强度依次逐渐减弱。

  • 强引用:只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象
  • 软引用:在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收
  • 弱引用:被弱引用关联的对象只能生存到下一次垃圾收集发生为止
  • 虚引用:也称为“幽灵引用”或者“幻影引用”,一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知

(3) 回收方法区

方法区垃圾收集的“性价比”通常是比较低的。方法区的垃圾收集主要回收两部分内容:废弃的常量和不再使用的类型

  • 废弃的常量:已经没有任何字符串对象引用常量池中的“java”常量,且虚拟机中也没有其他地方引用这个字面量

  • 不再使用的类型:

    • 该类所有的实例都已经被回收
    • 加载该类的类加载器已经被回收
    • 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法

    Java虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是“被允许”,而并不是和对象一样,没有引用了就必然会回收

(4) 垃圾收集算法

从如何判定对象消亡的角度出发,垃圾收集算法可以划分为“引用计数式垃圾收集”和“追踪式垃圾收集”两大类,这两类也常被称作“直接垃圾收集”和“间接垃圾收集”

1) 分代收集理论

收集器应该将Java堆划分出不同的区域,然后将回收对象依据其年龄(年龄即对象熬过垃圾收集过程的次数)分配到不同的区域之中存储。一般至少会把Java堆划分为新生代(Young Generation)和老年代(Old Generation)两个区域。新生代存放生存时间较短的对象,垃圾回收的频率比较高,而老年代存放生存时间较长的对象,垃圾回收的频率比较低。

  • 部分收集(Partial GC):指目标不是完整收集整个Java堆的垃圾收集
    • 新生代收集(Minor GC/Young GC):指目标只是新生代的垃圾收集,回收比Full GC频繁
    • 老年代收集(Major GC/Old GC):指目标只是老年代的垃圾收集。目前只有CMS收集器会有单
      独收集老年代的行为
    • 混合收集(Mixed GC):指目标是收集整个新生代以及部分老年代的垃圾收集。目前只有G1收
      集器会有这种行为
  • 整堆收集(Full GC):收集整个Java堆和方法区的垃圾收集。
2) 标记-清除(Mark-Sweep)算法

首先标记出所有需要回收的对象,在标记完成后,统一回收掉所有被标记的对象,也可以反过来,标记存活的对象,统一回收所有未被标记的对象。缺点是执行效率不稳定,且存在内存空间的碎片化问题

3) 标记-复制算法

简称为复制算法,它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。缺点是将可用内存缩小为了原来的一半。采用这种收集算法去回收新生代

Appel式回收的具体做法是把新生代分为一块较大的Eden空间和两块较小的Survivor空间,每次分配内存只使用Eden和其中一块Survivor。发生垃圾搜集时,将Eden和Survivor中仍然存活的对象一次性复制到另外一块Survivor空间上,然后直接清理掉Eden和已用过的那块Survivor空间。当Survivor空间不足以容纳一次Minor GC之后存活的对象时,就需要依赖其他内存区域(实际上大多就是老年代)进行分配担保

4) 标记-整理算法

标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向内存空间一端移动,然后直接清理掉边界以外的内存

HotSpot虚拟机里面关注吞吐量的Parallel Scavenge收集器是基于标记-整理算法的,而关注延迟的CMS收集器则是基于标记-清除算法的

新生代垃圾回收器一般采用的是复制算法;老年代回收器一般采用的是标记-整理的算法进行垃圾回收。

(5) 经典垃圾收集器

如果两个收集器之间存在连线,就说明它们可以搭配使用,图中收集器所处的区域,则表示它是属于新生代收集器抑或是老年代收集器

  • Serial收集器:一个单线程工作的收集器,Serial收集器对于运行在客户端模式下的虚拟机来说是一个很好的选择
  • ParNew收集器:实质上是Serial收集器的多线程并行版本
  • Parallel Scavenge收集器:基于标记-复制算法实现的,是能够并行收集的多线程收集器,目标是达到一个可控制的吞吐量
    • 垃圾收集的自适应的调节策略
  • Serial Old收集器:是Serial收集器的老年代版本,它同样是一个单线程收集器,使用标记-整理算法
  • Parallel Old收集器:是Parallel Scavenge收集器的老年代版本,支持多线程并发收集,基于标记-整理算法实现
  • CMS收集器:是一种以获取最短回收停顿时间为目标的收集器,是基于标记-清除算法实现的,适用于基于浏览器的B/S系统的服务端
  • Garbage First收集器:简称G1收集器,主要面向服务端应用的垃圾收集器

(6) 内存分配与回收策略

新生对象通常会分配在新生代中,少数情况下(例如对象大小超过一定阈值)也可能会直接分配在老年代。

  • 对象优先在Eden分配:对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC
  • 大对象直接进入老年代:大对象就是指需要大量连续内存空间的Java对象,最典型的大对象便是那种很长的字符串,或者元素数量很庞大的数组。指定大于该设置值的对象直接在老年代分配
  • 长期存活的对象将进入老年代:对象通常在Eden区里诞生,如果经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,该对象会被移动到Survivor空间中,并且将其对象年龄设为1岁。对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15),就会被晋升到老年代中
  • 动态对象年龄判定:如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代
  • 空间分配担保:在发生Minor GC之前,虚拟机必须先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那这一次Minor GC可以确保是安全的,否则就要进行一次Full GC
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值