垃圾回收
- 如何判断对象可以回收
- 垃圾回收算法
- 分代垃圾回收
- 垃圾回收器
- 垃圾回收调优
如何判断对象可以回收
引用计数法
通过在对象头中分配一个空间来保存该对象被引用的次数。
可达性分析
通过一些被称为引用链(GC Roots)的对象作为起点,然后向下搜索,搜索走过的路径被称为(Reference Chain)。
当一个对象到 GC Roots 之间没有任何引用相连时,即从 GC Roots 到该对象节点不可达,则证明该对象是需要垃圾收集的。
- 哪些对象可以作为 GC Root ?
通过memory analyzer(MAT)+jmap idump:format=b,live,file=1.bin 进程ID
查看。- system class
- native stack
- thread
- busy monitor
引用
- 强引用
- 只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收
- 软引用(SoftReference)
- 仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收,回收软引用对象
- 可以配合引用队列来释放软引用自身
ReferenceQueue queue = new ReferenceQueue(); SoftReference reference = new SoftReference(obj, queue);
- 弱引用(WeakReference)
- 仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
- 可以配合引用队列来释放弱引用自身
- 虚引用(PhantomReference)
- 必须配合引用队列使用,主要配合 ByteBuffer 使用,被引用对象回收时,会将虚引用(指向直接内存cleaner地址)入队,由 Reference Handler 线程调用虚引用相关方法Unsafe.freeMemory释放直接内存
- 终结器引用(FinalReference)
- 无需手动编码,但其内部配合引用队列使用。在垃圾回收时,终结器引用入队(被引用对象暂时没有被回收),再由 Finalizer 线程通过终结器引用找到被引用对象并调用它的 finalize方法,第二次 GC 时才能回收被引用对象
垃圾回收算法
jvm结合多种算法共同实现。
标记清除
- 优点是实现简单, 速度快
- 缺点是回收过程中会产生内存碎片
标记整理
- 优点是没有内存碎片
- 缺点是速度慢
复制
- 优点是没有内存碎片
- 缺点是浪费了一半的内存空间
分代垃圾回收
新生代
新生代的垃圾收集主要采用标记-复制算法,因为新生代的存活对象比较少,每次复制少量的存活对象效率比较高。
默认 Eden 和 Survivor 的大小比例是 8∶1。
- 对象首先分配在伊甸园区域
- 新生代空间不足时,触发 minor gc,伊甸园和 from 存活的对象使用 copy 复制到 to 中,存活的对象年龄加 1并且交换 from、to
- minor gc 会引发 stop the world,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行
- 当对象寿命超过阈值时,会晋升至老年代,最大寿命是15(4bit)
老年代
- 当老年代空间不足,会先尝试触发 minor gc,如果之后空间仍不足,那么触发 full gc,STW的时间更长
相关参数
含义 | 参数 |
---|---|
堆初始大小 | -Xms |
堆最大大小 | -Xmx 或 -XX:MaxHeapSize=size |
新生代大小 | -Xmn 或 (-XX:NewSize=size + -XX:MaxNewSize=size ) |
幸存区比例(动态) | -XX:InitialSurvivorRatio=ratio 和 -XX:+UseAdaptiveSizePolicy |
幸存区比例 | -XX:SurvivorRatio=ratio |
晋升阈值 | -XX:MaxTenuringThreshold=threshold |
晋升详情 | -XX:+PrintTenuringDistribution |
GC详情 | -XX:+PrintGCDetails -verbose:gc |
FullGC 前 MinorGC -XX:+ScavengeBeforeFullGC |
垃圾回收器
串行( eg. Serial 收集器)
- 单线程
- 堆内存较小,适合个人电脑
-XX:+UseSerialGC = Serial + SerialOld
吞吐量优先(eg. Parallel Scavenge 收集器)
- 多线程
- 堆内存较大,多核 cpu
- 让单位时间内,STW 的时间最短 【1h内】0.2 0.2 = 0.4,(垃圾回收时间占比最低,这样就称吞吐量高)
-XX:+UseParallelGC ~ -XX:+UseParallelOldGC
-XX:+UseAdaptiveSizePolicy
-XX:GCTimeRatio=ratio
-XX:MaxGCPauseMillis=ms
-XX:ParallelGCThreads=n
响应时间优先(eg. CMS 收集器 , 采用“标记-清除”算法)
- 多线程
- 堆内存较大,多核 cpu
- 尽可能让单次 STW 的时间最短 【1h内】0.1 0.1 0.1 0.1 0.1 = 0.5
-XX:+UseConcMarkSweepGC ~ -XX:+UseParNewGC ~ SerialOld
-XX:ParallelGCThreads=n ~ -XX:ConcGCThreads=threads
-XX:CMSInitiatingOccupancyFraction=percent
-XX:+CMSScavengeBeforeRemark
G1垃圾回收器(Garbage First,+取代CMS)
适用场景
- 同时注重吞吐量(Throughput)和低延迟(Low latency),默认的暂停目标是 200 ms
- 超大堆内存,会将堆划分为多个大小相等的 Region【每个区域都可以扮演新生代(Eden 和 Survivor)或老年代】
- 整体上是 标记+整理 算法,两个区域之间是 复制 算法
相关 JVM 参数
-XX:+UseG1GC
-XX:G1HeapRegionSize=size
-XX:MaxGCPauseMillis=time
回收阶段
- Young GC(会 STW)
- 进行 GC Root 的初始标记
- 老年代占用堆空间比例达到阈值时,进行并发标记(不会 STW)
-XX:InitiatingHeapOccupancyPercent=percent
(默认45%) - Mix FC,对 E、S、O 进行全面垃圾回收。为了使STW尽可能短
-XX:MaxGCPauseMillis=ms
,G1 会计算出哪些区域的回收价值最高(也就是包含最多垃圾的区域),然后优先回收这些区域。这种回收方式包括了部分新生代区域和老年代区域。- 最终标记(Remark)会 STW
- 拷贝存活(Evacuation)会 STW
GC分类
- SerialGC
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足发生的垃圾收集 - full gc
- ParallelGC
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足发生的垃圾收集 - full gc
- CMS
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足
- G1
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足【垃圾回收的速度跟不上垃圾产生的速度时, 会full GC】
相关问题
Young Collection 跨代引用(老年代引用新生代)
引用新生代的部分标记为dirty card,后续GC Root时不用挨个遍历。
- 划分卡表,并将dirty card记录在 Remembered Set
- 在引用变更时通过 post-write barrier + dirty card queue(队列)
- concurrent refinement threads 更新 Remembered Set
Remark
问:C处理完之后,用户又对其进行引用?
此时引用发生变化的C会加上一个写屏障,把C加入队列且转为灰色。重新remark阶段会STW,取出队列中的对象一一检查。
字符串去重【版本:JDK 8u20 】
String s1 = new String("hello"); // char[]{'h','e','l','l','o'}
String s2 = new String("hello"); // char[]{'h','e','l','l','o'}
每次new都占用新内存,怎么办?
- GC优化,开关为
-XX:+UseStringDeduplication
- 将所有新分配的字符串放入一个队列
- 当新生代回收时,G1并发检查是否有字符串重复
- 如果它们值一样,让它们引用同一个 char[]
优点:节省大量内存
缺点:略微多占用了 cpu 时间,新生代回收时间略微增加
- String.intern()
并发标记类卸载【版本:JDK 8u40 】
-XX:+ClassUnloadingWithConcurrentMark
默认启用
所有对象都经过并发标记后,就能知道哪些类不再被使用,当一个类加载器的所有类都不再使用,则卸载它所加载的所有类
回收巨型对象【版本:JDK 8u60 】
一个对象大于 region 的一半时,称之为巨型对象.
G1 不会对巨型对象进行拷贝,回收时被优先考虑。
- G1 会跟踪老年代所有 incoming 引用,这样老年代 incoming 引用为0 的巨型对象就可以在新生代垃圾回收时处理掉
并发标记起始时间的调整【版本:JDK 9】
并发标记必须在堆空间占满前完成,否则退化为 FullGC
- JDK 9 之前需要使用
-XX:InitiatingHeapOccupancyPercent
(45%) - JDK 9 可以动态调整
-XX:InitiatingHeapOccupancyPercent
用来设置初始值- 进行数据采样并动态调整
- 总会添加一个安全的空档空间
高效的回收【版本:JDK 9】
https://docs.oracle.com/en/java/javase/12/gctuning