垃圾回收之标记算法
什么是垃圾?没有被其他对象引用。
怎样判断垃圾?引用计数算法和可达性分析算法。
引用计数算法(判断对象的引用数量)
-
通过判断对象的引用数量来决定对象是否可以被回收
-
每个对象实例(存储在堆中)都有一个引用计数器,被引用(通过虚拟机栈)则+1,完成引用(超出引用变量的作用域范围)则-1
-
任何引用计数为0的对象实例可以被当作垃圾收集
优点:执行效率高,程序执行受影响较小
缺点:无法检测出循环引用的情况,导致内存泄漏
可达性分析算法
-
通过判断对象的引用链是否可达来决定对象是否可以被回收,将所有的对象和引用关系用图来表示,以GC Roots的节点为起始点进行搜索,搜索的路径被称之为引用链,如果从所有的GC Roots到某一个对象都没有引用链进行相连,说明该对象不可达,则该对象被标记为垃圾。
-
垃圾回收器会对内存中的整个对象图进行遍历,将能被遍历到的对象标记为存活。
可以作为GC Root的对象:
- 虚拟机栈中引用的对象,也就是在方法中new()出来的对象(栈帧中的本地变量表)
- 方法区中的常量引用的对象,即在类中定义一个常量,该常量保存的是某个对象的引用地址,则该对象也会被当作GC Root。
- 方法区中的类静态属性引用的对象。
- 本地方法栈中JNI(Native方法)的引用对象
- 活跃线程的引用对象
垃圾回收算法
标记-清除算法(Mark and Sweep)(Old区),将回收过程分为两部分:
-
标记Mark阶段,从根集合(GC Roots)进行扫描,对存活的对象进行标记。
-
清除Sweep阶段,对堆内存从头到尾进行线性遍历,回收不可达对象内存。
**缺点:**碎片化,碎片化可能对导致需要较大内存空间的对象没有连续空间进行存储,从而引发又一次的GC,直至内存溢出。
复制算法(Copying)
-
将可用内存分为对象面和空闲面
-
对象在对象面上创建
-
存活的对象被从对象面复制到空闲面
-
将对象面所有对象内存清除
优点:
- 适用于对象存活率较低的场景(Eden区)
- 解决碎片化问题
- 顺序分配内存,简单高效
缺点:
- 在存活率较高的场景中,需要进行大量复制,效率低
标记-整理算法(Compacting)
-
标记:从根集合进行扫描,对存活的对象进行标记
-
清除:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收。
优点:
- 避免内存的不连续行、碎片化问题
- 不用设置两块内存互换
- 适用于存活率高的场景(Old区)
分代收集算法(Generational Collector),主流垃圾回收算法
- 垃圾回收算法的组合拳
- 按照对象生命周期的不同划分区域以采用不同的垃圾回收算法
- 提高JVM的回收效率
堆的内部结构
堆,存放对象的内存区域,内存区域可划分为:老年代(old区)、年轻代(eden区、from-to区)。
- eden区:新创建的对象都会放在eden区(当对象占有内存较大时,也有可能直接存放在old区),当eden区的存储空间不足时,会触发minor GC(范围为eden、from或to)。通过垃圾回收,释放掉垃圾对象,未被回收的对象全部存放至survivor区的from或to中并且分代年龄+1.
- from-to区:from和to区统称为survivor区(from-to区会随着垃圾回收机制不断转换),经过minor GC后,from区和eden区未被回收的对象全部移入to区或者to区和eden区未被回收的对象移入from区。当survivor区中由对象的分代年龄超过15次,会移入到old区。
- old区 :随着程序的不断运行,old区空间会越来越少。当空间不足以存储survivor区移入的对象,会进行一次full GC(范围为整个堆),如果仍然空间不足,就会抛出异常。
GC的分类
Minor GC,发生在Eden区,采用复制算法。
Full GC,频率较低,其触发条件:
- 老年代空间不足(jdk8以上),jdk8以上取消了永久代(因此第二条不存在),使用元空间进行替代,为了减少Full GC的触发频率。
- 永久代空间不足(jdk7及以下)
- CMS GC时出现promotion failed,concurrent mode failure
- Minor GC晋升到老年代的平均大小大于老年代的剩余空间
- 显示调用System.gc(),但最终由JVM决定是否执行
- 使用RMI来进行RPC或管理的JDK应用,每小时执行一次Full GC
分代收集算法
-
年轻代:尽可能快速地收集掉那些生命周期短的对象。
-
**老年代:**存放生命周期较长的对象。
-
对象如何晋升到老年代:
- 1.经历一定Minor GC次数(默认是15次)依然存活的对象。
- 2.Survivor区中存放不下的对象,由old区分配担保机制,直接进入老年代。
- 3.当对象占有内存较大时,也有可能直接存放在old区(-XX:+PretenuerSizeThreshold)
-
分代年龄:
堆中的对象(分对年龄初始化为0)经历过一次GC后未被回收,该对象的分代年龄+1。
-
常用的调优参数
- -XX:SurvivorRation,Eden和Survivor的比值,默认8:2
- -XX:NewRation,老年代和年轻代内存大小的比例
- -XX:MaxTenuringThreshold,对象从年轻代晋升到老年代经过的GC次数的最大阈值
-
JVM性能调优:
性能调优的主要目的是减少GC(minor GC 、full GC)的发生频率,因为GC过程中会STW(Stop the Wolrd)停掉所有的线程。尤其是full GC需要在整个堆中进行垃圾回收,非常耗时,用户等请求等待时间会很长。(minor GC时间很短,几乎察觉不出)
常见垃圾收集器
Object的finalize()方法的作用是否与C++的析构函数作用相同?
Java中的强引用、软引用、弱引用、虚引用有什么作用?
-
强引用(Strong Reference)
-
最普遍的引用:Object obj = new Object()
-
抛出OutOfMemoryError终止程序也不会回收具有强引用的对象
-
通过将对象设置为null来弱化引用,使其被回收
String str = new String("abc")
-
-
软引用(Soft Reference)
-
对象处在有用但非必须的状态
-
只有当内存空间不足时,GC会回收该引用对象的内存
-
可以用来实现高速缓存
String str = new String("abc") SoftReference<String> softRef = new SoftRefenence<String>(str)
-
-
弱引用(Weak Reference)
-
非必须的对象,比软引用更弱一些
-
GC时会被回收
-
被回收的概率也不大,因为GC线程优先级比较低
-
适用于引用偶尔被使用且不影响垃圾收集的对象
String str = new String("abc") WeakReference<String> weakRef = new WeakRefenence<String>(str)
-
-
虚引用(PhantomReference)
-
不会决定对象的生命周期
-
任何时候都可能被垃圾收集器回收
-
跟踪对象被垃圾收集器回收的活动,起哨兵作用
-
必须和引用队列ReferenceQueue联合使用
String str = new String("abc") ReferenceQueue queue = new ReferenceQueue() PhantomReference ref = new PhantomReference(str,queue)
-
引用队列(ReferenceQueue)
-
无实际存储结构,存储逻辑依赖于内部节点之间的关系来表达
-
存储关联的且被GC的软引用、弱引用以及虚引用
String str = new String("abc") WeakReference<String> weakRef = new WeakRefenence<String>(str)
例如:上面的弱引用,weakRef为弱引用对象,引用的是“abc”实例。当“abc”实例只有weakRef弱引用是,垃圾回收时“abc”实例会被回收,weakRef引用对象会被放入到ReferenceQueue队列中。