垃圾回收算法
大体以下几类:
1. 引用计数法
2. 标记清除法
3. 复制算法
4. 标记压缩算法(标记整理)
5. 分代算法、分区算法
引用计数法
对象有一个引用计数器,当一个对象被引用时,计数器加1,引用失效时,计数器减1,垃圾回收时,回收掉计数器为0的对象。
缺点:无法避免循环引用。如下代码:user1和uesr2对象属于没有再被其它对象引用的,可以被回收的"垃圾"对象,但是因为互相引用,所以gc时无法回收掉(引用计数器不为0)。
public static void main(String[] args) {
User user1 = new User();
User user2 = new User();
user1.user = user2;
user2.user = user1;
}
p.s. JVM并未采用引用计数法。
标记清除法
分为标记,清除两个阶段。
在标记阶段标记所有可回收的对象,在清除阶段将被标记的对象回收释放内存。(见过有的资料说明标记存活对象,回收的就都是垃圾对象,还未翻过JVM的源码实现,此处保留看法)
缺点:产生内存碎片,当大对象太多找不到合适的连续内存分配,进而频繁进行垃圾回收,导致性能问题。如下:
p.s. 对象是否存活或者需要被回收,是通过可达性分析来确定,关于可达性分析本文不作重点。
复制算法
内存分为相等的两部分,只使用其中一部分,垃圾回收时把存活的对象复制到另一块未使用的内存,对当前内存整个回收。
优点是解决了标记清除是内存碎片和性能缺陷,缺点是内存折半,比较浪费,存活对象较多时,效率会变低。
p.s. JVM的新生代会使用复制算法,但不是内存分为相等的两部分,而是分为eden、from、to这3个区,from/to也叫做survivor区,内存占比中,eden:survivor默认是8:1,也就是说eden占eden+from+to的总大小的8/10,另外两个各占这3区总和的1/10,这是默认比例,可以通过虚拟机参数调整。使用时主要使用eden区和其中的一个survivor区,回收时将存活的对象放到另一个survivor区。这样分配是因为IBM研究表明新后代中98的对象朝生夕死的,在垃圾回收时大部分会被回收掉。
标记压缩算法
也说标记整理算法
类似标记清除,不同的是,标记之后是直接简单的清理对象,而是存活的对象向内存一端移动,最后直接清理掉边界以外的内存。如下:
p.s. 主要用在JVM的老年代
分代算法、分区算法
上面提到的几个算法各有优缺,分代算法是将内存分为新生代、老年代等不同区域,根据需要各个区域使用上面的几种算法。
分区算法是将整个堆空间分为连续的不同小区间,每个小区间独立使用,独立回收,可以控制回收时的空间大小,缓解堆越大,GC停顿越久的问题。