GC垃圾回收
为什么要垃圾回收
- Java语言中一个显著的特点就是引入了垃圾回收机制,由于有个垃圾回收机制,Java中的对象不再有“作用域”的概念,只有对象的引用才有“作用域”。垃圾回收可以有效的防止内存泄露,有效的使用空闲的内存。
- 在Java堆中,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,只有在程序处于运行期间才会知道需要创建哪些对象,这部分内存的分配和回收都是动态的。
- 堆中几乎存放着Java世界中所有的对象实例,垃圾收集器在对堆进行回收前,第一件事就是确定哪些对象还“存活”着,哪些已经“死去”不可能被任何途径使用的对象。
对象是否存活判断:
- 堆中每个对象实例都有一个引用计数。
- 当一个对象被创建时,且将该对象实例分配给一个变量,该变量计数设置为1。
- 当任何其它变量被赋值为这个对象的引用时,计数+1(a = b,则b引用的对象实例的计数器+1)
- 但当一个对象实例的某个引用超过了生命周期或者被设置为一个新值时,对象实例的引用计数器 -1。
- 任何引用计数器为0的对象实例可以被当作垃圾收集。当一个对象实例被垃圾收集时,它引用的任何对象实例的引用计数器 -1。
对象存活算法:
1.引用计数法:
引用计数法存在的特点分析:
-
优缺点
- 引用计数收集器可以很快的执行,交织在程序运行中。对程序需要不被长时间打断的实时环境比较有利。【简单,快捷,方便,容易理解】
- 无法检测出循环引用。如父对象有一个对子对象的引用,子对象反过来引用父对象。这样,他们的引用计数永远不为0。
-
代码分析JVM是否引用计数器
-
两个对象相互引用,再无其他任何引用,按理两个对象已经不可能再被访问,但是它们因为互相引用,导致它们的引用计数都不为0,所以引用计数器无法通知GC收集器回收它们。
-
但是结果是有进行垃圾回收,没有进行计数引用。
-
run configurations-vm options -加配置 打印GC日志
-
public class ReferenceCountingGC {
public Object obj = null;
private static final int num = 1024*1024;
private byte[] bigSize = new byte[2*num];
public static void main(String[] args) {
ReferenceCountingGC gcA = new ReferenceCountingGC();
ReferenceCountingGC gcB = new ReferenceCountingGC();
gcA.obj = gcB;
gcB.obj = gcA;
gcA = null;
gcB = null;
System.gc(); //有进行垃圾回收,没有进行计数引用
}
}
- 通过GC日志,看到虚拟机并没有因为两个对象相互引用就不回收它们,从此说明虚拟机并不是通过引用计数算法来判断是否存活的。
2.可达性分析(跟搜索法):
- 根搜索算法是从离散数学中的图论引用的,程序把所有的引用关系看作一张图,从一个节点GC ROOT开始,寻找对应的引用节点,找到这个节点以后,继续寻找这个节点的引用节点,当所有的引用节点寻找完毕之后,剩余的节点则被认为是没有被引用到的节点,即无用节点。
- Java中可作为GC ROOT的对象有:
-
虚拟机栈中的引用对象(本地变量表)
- 本地方法栈中的引用对象
- 方法区中静态属性引用的对象
- 方法区中常量引用的对象
垃圾收集算法
1.标记清除算法
- 最基础的收集算法是“标记-清除”算法,如它的名字一样,算法分为“标记”
和“清除”两个阶段: - 首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
- 主要缺点:
- 一个是效率问题,标记和清除两个过程的效率都不高
- 另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。【垃圾回收之后,使用的内存和空闲的内存是不连续的,遇到需要分配较大的内存的对象时,{标记清除之后的内存是不连续的,是缺点,不可取,不常使用}】
2.复制算法
- 为什么出现复制算法:
- 为了解决效率问题,一种称为“复制”的收集算法出现了,它将可用内存按量划分为大小相等的两块,每次只使用其中的一块。
- 当这一块的内存用完了,就将还存活着的对象复制到另一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。
- 现在的商业虚拟机都采用这种收集算法来回收新生代
- 新生代中的对象 98%是“朝生夕死”的,所以并不需要按照 1:1 的比例来划分内存空间,而是将内存分为一块较大的 Eden 空间和两块较小的 Survivor 空间,每次使用 Eden 和其中一块 Survivor; Survivor from 和Survivor to ,内存比例 8:1:1
- Survivor to主要保存Eden区和Survivor from区存活的对象。
- 存放完之后,会将Survivor to的对象拷贝到Survivor from区中,再进行下一次的垃圾回收。
- 当回收时,将 Eden 和 Survivor 中还存活着的对象一次性地复制到另外一块 Survivor 空间上,最后清理掉 Eden 和刚才用过的 Survivor 空间。
- HotSpot 虚拟机默认 Eden 和 Survivor 的大小比例是 8:1, 也就是每次新生代中可用内存空间为整个新生代容量的 90% (80%+10%),只有 10% 的内存会被“浪费”。
- 当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于 10%的对象存活,当 Survivor 空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)。
3.标记整理算法
- 标记整理算法所解决的问题
- 复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。
- 根据老年代的特点,有人提出了另一种“标记-整理(Mark-Compact)”算法,标记过程仍然与“标记-清除”算法一样,但后序步骤不是直接对可回收对象进行整理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
4.分代收集算法
- 一般把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
- 在新生代中,每次垃圾收集时都会发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。
- 而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法来进行回收。