如何确定什么是垃圾,什么是可以回收的?
在堆中存放着对象实例,GC回收器在对堆进行回收前,需要确定哪些对象需要被回收,即确定哪些对象还存活,哪些对象已经死去(即不可能在被任何途径使用的对象)
1. 引用计数法:给每个对象设定一个计数器,当一个对象如果有一次引用就加1,引用失效就减去一,当一个对象的计数为0的时候就代表这个对象可以被回收。
优点:简单方便
缺点: 存在着循环引用问题,例如 对象A 只引用着对象B,对象B只引用着对象A,对象A和对象B的计数都不为零,无法进行垃圾回收。(之后再把对象A和B都设置为null,引用失效)。
2.可达性分析算法:
目前Java虚拟机的主流垃圾回收器采取的是可达性分析这种算法。
这个算法的实质在于将一系列GC Roots作为初始的存活对象合集,然后从该合集出发,探索所有能够被该合集引用到的对象,并将其加入到该和集中,这个过程称之为标记。 最终,未被探索到的对象便是死亡的,是可以回收的。
要注意的是,不可达对象不等价于可回收对象,不可达对象变为可回收对象至少要经过两次标记 过程。两次标记后仍然是可回收对象,则将面临回收。
一般而言的GC Root:(GC Roots可以理解为由堆 外指向堆内的引用)
- 已经加载类的静态变量
- 虚拟机栈 栈帧中的局部变量
- JNI handles
- 已经启动还未停止的线程
JVM算法
1. 标记清除:
最基础的垃圾回收算法,分为两个阶段,标注和清除。标记阶段标记出所有需要回收的对象,清 除阶段回收被标记的对象所占用的空间。
缺点:内存的碎片化,后续可能发生大对象不能找到可 利用空间的问题。
2.复制算法:
把内存分为大小相等的两块,只使用其中的一块,换句话说就是是使用一半的内存。
然后这一块内存使用完之后,把存活的对象复制到另一块内存上区,然后清除已使用的内存。
虽然说解决了内存碎片化的问题,但是这种方法内存的利用率只有50%
3. 标记整理算法
结合了以上两个算法,为了避免缺陷而提出。标记阶段和 标记清除 算法相同,标记后不是清 理对象,而是将存活对象移向内存的一端。然后清除端边界外的对象。
目前主流的JVM主要使用的是分代收集的思想:
将内存分为年轻代和老年代。刚创建的对象就分配在年轻代,所以年轻代一般会回收大量的对象,所以年轻代使用复制算法来进行垃圾回收。
1. 对象的内存分配主要在新生代的 Eden Space 和 Survivor Space 的 From Space(Survivor 目 前存放对象的那一块),少数情况会直接分配到老生代。 2. 当新生代的 Eden Space 和 From Space 空间不足时就会发生一次 GC,进行 GC 后,Eden Space 和 From Space 区的存活对象会被挪到 To Space,然后将 Eden Space 和 From Space 进行清理。 3. 如果 To Space 无法足够存储某个对象,则将这个对象存储到老生代。 4. 在进行 GC 后,使用的便是 Eden Space 和 To Space 了,如此反复循环。 5. 当对象在 Survivor 区躲过一次 GC 后,其年龄就会+1。默认情况下年龄到达 15 的对象会被 移到老生代中.
对象一般经过了几次GC之后才会进入老年代,所以在老年代中的对象一般比较稳定,所以老年代回收的对象较少,所以老年代使用的垃圾回收算法是标记整理算法。