相信熟悉Java
的开发者一定会经常听说垃圾回收这个词,可能也知道这是Java
语言的一大特色(相比于C
语言,Java
语言会自动进行垃圾回收,这样开发者就可以不用关心内存的是否释放,大大减轻了自己的工作量,同时也能避免因忘记释放内存导致内存泄漏的情况发生。),但是并不是所有人都明白垃圾回收的工作原理。
下面,我们将一起揭开垃圾回收的面纱,弄清楚它的工作机制。
一、如何判断对象是垃圾
1.1 引用计数法
定义:对于一个对象,每当有一个引用指向它,计数加一,每当一个指向它的引用失效时,计数减一。计数为0的对象将被视为垃圾被回收。
缺点:循环引用。下面A对象和B对象的计数都是1,虽然它们已经不能被使用(外界拿不到它们了),但由于计数不为0,所以也不会被当成垃圾进行回收,就会造成内存泄漏问题。
1.2 可达性分析算法
定义:根对象不可达的对象即是垃圾。
根对象:GC Root
,是JVM确定当前绝对不会被回收的对象。
根可达:对象到GC Roots
存在直接或间接的引用关系。
在下图中,A对象是根对象,它直接引用B对象。B对象引用C对象和D对象,也就相当于A对象间接引用这C对象和D对象。所以B,C,D都是根可达的。E显而易见是根不可达的,所以E对象就是垃圾,需要回收它占用的内存。
JVM
中的垃圾回收器就是采用可达性分析来探索所有存活的对象。JVM
通过扫描对象中的对象,看是否能够沿着以GC Root
对象为起点的引用链找到该对象,找不到,则说明此对象是垃圾对象,需要回收。
二、垃圾回收算法
找到了什么是垃圾,现在我们就需要关心怎么去回收了。JVM
中垃圾回收有3种经典的方式,分别是标记清除(Mark Sweep
),标记整理(Mark Compact
)和复制(Copy
)。
2.1 标记清除算法
定义:首先回收器会从根节点开始通过引用遍历堆中对象,并标记所有根可达的对象。之后回收器会从头到尾遍历堆中对象,回收掉未被标记的对象。
优点:速度块
缺点:容易产生内存碎片。如下图,因为垃圾对象在堆中很可能不是连续分布,所以这种算法回收的内存也会是一块隔着一块的。回收的内存块有的可能太小以至于根本用不了,就产生了内存碎片。
2.2 标记整理算法
定义:标记垃圾的机制和上面一样,也是以根对象,通过引用遍历堆中对象并标记。回收器第二次遍历的时候会在直接让存活对象往前移,在这个过程中,垃圾对象占用的空间会直接被覆盖,也就是了回收其内存。如下图。
优点:没有内存碎片。
缺点:因为要移动对象,所以速度很慢
2.3 复制算法
定义:将内存分为From区
和To区
,回收器会将有用的对象从From区
复制到To区
,这样From区
就整体回收掉。然后再交换From
和To
的位置,To
区域总是空的。如下图。
优点:不会产生碎片
缺点:会占用双倍的内存空间
在实际的垃圾回收中,JVM
不会固定地只使用某一种算法,而是结合三种算法,协同工作。
三、分代垃圾回收
首先观察JVM
堆的结构,JVM
把堆内存划分成了两大块:新生代和老年代。新生代又划分成三个小区域:伊甸园、幸存区From和幸存区To。长时间使用的对象就放在老年代中,用完了就可以丢弃的对象放在新生代中。这样就可以根据区域来使用不同的垃圾回收策略。老年代垃圾回收就很久发生一次,新生代就比较频繁。
3.1 回收流程
-
当新建一个对象时,会将其放在伊甸园中。