参考资料
本笔记是基于黑马程序员的课件以及视频资料所做。所涉及的资料可在下面的度盘链接找到:
链接:https://pan.baidu.com/s/1JtV0zFS5yFa7edGxSqQYeQ
提取码:i6vv
1. 如何判断对象可以回收
1.1 引用计数法
-
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器的值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。这也就是需要回收的对象。
-
引用计数算法是对象记录自己被多少程序引用,引用计数为零的对象将被清除。
-
计数器表示的是有多少程序引用了这个对象(被引用数)。计数器是无符号整数。
弊端:循环引用时,两个对象的计数都为1,导致两个对象都无法被释放
1.2 可达性分析算法
- JVM中的垃圾回收器通过可达性分析来探索所有存活的对象
- 扫描堆中的对象,看能否沿着GC Root对象为起点的引用链找到该对象,如果找不到,则表示可以回收
- 可以作为GC Root的对象
- 虚拟机栈(栈帧中的本地变量表)中引用的对象。
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中JNI(即一般说的Native方法)引用的对象
1.3 5种引用
1.3.1 强引用
只有GC Root都不引用该对象时,才会回收强引用对象
如上图B、C对象都不引用A1对象时,A1对象才会被回收
1.3.2 软引用(SoftReference)
-
仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收,回收软引用对象
-
可以配合引用队列来释放软引用自身
如上图如果B对象不再引用A2对象且内存不足时,软引用所引用的A2对象就会被回收
1.3.3 弱引用(WeakReference)
-
仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
-
可以配合引用队列来释放弱引用自身
如上图如果B对象不再引用A3对象,则A3对象会被回收
1.3.4 虚引用(PhantomReference)
-
必须配合引用队列使用,主要配合 ByteBuffer 使用,被引用对象回收时,会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存
-
虚引用的一个体现是释放直接内存所分配的内存,当引用的对象ByteBuffer被垃圾回收以后,虚引用对象Cleaner就会被放入引用队列中,然后调用Cleaner的clean方法来释放直接内存
如上图,B对象不再引用ByteBuffer对象,ByteBuffer就会被回收。但是直接内存中的内存还未被回收。这时需要将虚引用对象Cleaner放入引用队列中,然后调用它的clean方法来释放直接内存
1.3.5 终结器引用(FinalReference)
无需手动编码,但其内部配合引用队列使用,在垃圾回收时,终结器引用入队(被引用对象暂时没有被回收),再由 Finalizer 线程通过终结器引用找到被引用对象并调用它的 finalize
方法,第二次 GC 时才能回收被引用对象
如上图,B对象不再引用A4对象。这时终结器对象就会被放入引用队列中,引用队列会根据它,找到它所引用的对象。然后调用被引用对象的finalize方法。调用以后,该对象就可以被垃圾回收了
1.3.6 引用队列
-
软引用和弱引用可以配合引用队列
在弱引用和虚引用所引用的对象被回收以后,会将这些引用放入引用队列中,方便一起回收这些软/弱引用对象 -
虚引用和终结器引用必须配合引用队列
虚引用和终结器引用在使用时会关联一个引用队列
1.3.7 示例
演示软引用
/**
* 演示软引用
* -Xmx20m -XX:+PrintGCDetails -verbose:gc
*/
public class Demo1 {
private static final int _4MB = 4 * 1024 * 1024;
public static void main(String[] args) throws IOException {
soft();
}
public static void soft() {
// list --> SoftReference --> byte[]
List<SoftReference<byte[]>> list = new ArrayList<>();
for (int i = 0; i < 5; i++) {
SoftReference<byte[]> ref = new SoftReference<>(new byte[_4MB]);
System.out.println(ref.get());
list.add(ref);
System.out.println(list.size());
}
System.out.println("循环结束:" + list.size());
for (SoftReference<byte[]> ref : list) {
System.out.println(ref.get());
}
}
}
如果在垃圾回收时发现内存不足,在回收软引用所指向的对象时,软引用本身不会被清理
如果想要清理软引用,需要使用引用队列
public class Demo2 {
private static final int _4MB = 4 * 1024 * 1024;
public static void main(String[] args) {
List<SoftReference<byte[]>> list = new ArrayList<>();
// 引用队列
ReferenceQueue<byte[]> queue = new ReferenceQueue<>();
for (int i = 0; i < 5; i++) {
// 关联了引用队列, 当软引用所关联的 byte[]被回收时,软引用自己会加入到 queue 中去
SoftReference<byte[]> ref = new SoftReference<>(new byte[_4MB], queue);
System.out.println(ref.get());
list.add(ref);
System.out.println(list.size());
}
// 从队列中获取无用的 软引用对象,并移除
Reference<? extends byte[]> poll = queue.poll();
while( poll != null) {
list.remove(poll);
poll = queue.poll();
}
System.out.println("===========================");
for (SoftReference<byte[]> reference : list) {
System.out.println(reference.get());
}
}
}
演示弱引用
/**
* 演示弱引用
* -Xmx20m -XX:+PrintGCDetails -verbose:gc
*/
public class Demo3 {
private static final int _4MB = 4 * 1024 * 1024;
public static void main(String[] args) {
// list --> WeakReference --> byte[]
List<WeakReference<byte[]>> list = new ArrayList<>();
for (int i = 0; i < 10; i++) {
WeakReference<byte[]> ref = new WeakReference<>(new byte[_4MB]);
list.add(ref);
for (WeakReference<byte[]> w : list) {
System.out.print(w.get()+" ");
}
System.out.println();
}
System.out.println("循环结束:" + list.size());
}
}
2. 垃圾回收算法
2.1 标记清除
2.1.1 定义
Mark Sweep
-
标记清除算法,是指在虚拟机执行垃圾回收的过程中,先采用标记算法确定可回收对象,然后垃圾收集器根据标识清除相应的内容,给堆内存腾出相应的空间
这里的腾出内存空间并不是将内存空间的字节清0,而是记录下这段内存的起始结束地址,下次分配内存的时候,会直接覆盖这段内存
2.1.2 特点
-
速度较快
-
会造成内存碎片
可能无法满足大对象的内存分配,一旦导致无法分配对象,那就会导致jvm启动gc,一旦启动gc,我们的应用程序就会暂停,这就导致应用的响应速度变慢
2.2 标记整理
2.2.1 定义
会将不被GC Root引用的对象回收,清除其占用的内存空间。然后整理剩余的对象,可以有效避免因内存碎片而导致的问题,但是因为整体需要消耗一定的时间,所以效率较低
2.2.2 特点
- 速度慢
- 没有内存碎片
2.3 复制
2.3.1 定义
将内存分为等大小的两个区域,FROM和TO(TO中为空)。先将被GC Root引用的对象从FROM放入TO中,再回收不被GC Root引用的对象。然后交换FROM和TO。
-
先将被GC Root引用的对象从FROM放入TO中
-
再回收不被GC Root引用的对象
-
然后交换FROM和TO
2.3.2 特点
-
不会有内存碎片
-
需要占用双倍内存空间
3. 分代垃圾回收
3.1 流程
-
新创建的对象都被分配放在了新生代的伊甸园中
-
新生代空间不足时,触发
minor gc
,伊甸园和 from 存活的对象使用 copy 复制到 to 中,存活的对象年龄加 1并且交换 from to -
minor gc
会引发stop the world
,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行 -
当对象寿命超过阈值时,会晋升至老年代,最大寿命是
15(4bit)
-
当老年代空间不足,会先尝试触发
minor gc
,如果之后空间仍不足,那么触发 full gc,扫描新生代和老年代中所有不再使用的对象并回收,stop the world的时间更长。
3.2 相关 VM 参数
3.3 GC 分析
-
大对象处理策略
当遇到一个较大的对象时,就算新生代的伊甸园为空,也无法容纳该对象时,会将该对象直接晋升为老年代
-
线程内存溢出
-
某个线程的内存溢出了而抛异常(out of memory,OOM),不会让其他的线程结束运行
-
这是因为当一个线程抛出OOM异常后,它所占据的内存资源会全部被释放掉,从而不会影响其他线程的运行,进程依然正常
-
4. 垃圾回收器
并行收集:指多条垃圾收集线程并行工作,但此时用户线程仍处于等待状态。
并发收集:指用户线程与垃圾收集线程同时工作(不一定是并行的可能会交替执行)。用户程序在继续运行,而垃圾收集程序运行在另一个CPU上
吞吐量:即CPU用于运行用户代码的时间与CPU总消耗时间的比值(吞吐量 = 运行用户代码时间 / ( 运行用户代码时间 + 垃圾收集时间 )),也就是。例如:虚拟机共运行100分钟,垃圾收集器花掉1分钟,那么吞吐量就是99%
4.1 串行
- 单线程
- 堆内存较小,适合个人电脑(CPU核数较少)
开启串行缓冲器:
-XX:+UseSerialGC = Serial + SerialOld
-
安全点:让其他线程都在这个点停下来,以免垃圾回收时移动对象地址,使得其他线程找不到被移动的对象
-
因为是串行的,所以只有一个垃圾回收线程。且在该线程执行回收工作时,其他线程进入阻塞状态
-
Serial 收集器
Serial收集器是最基本的、发展历史最悠久的收集器
特点:单线程、简单高效(与其他收集器的单线程相比),采用复制算法。对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。收集器进行垃圾回收时,必须暂停其他所有的工作线程,直到它结束(Stop The World)
-
ParNew 收集器
ParNew收集器其实就是Serial收集器的多线程版本
特点:多线程、ParNew收集器默认开启的收集线程数与CPU的数量相同,在CPU非常多的环境中,可以使用
-XX:ParallelGCThreads
参数来限制垃圾收集的线程数。和Serial收集器一样存在Stop The World问题 -
Serial Old 收集器
Serial Old是Serial收集器的老年代版本
特点:同样是单线程收集器,采用标记-整理算法
4.2 吞吐量优先
- 多线程
- 堆内存较大,多核CPU
- 单位时间内,STW(stop the world,停掉其他所有工作线程)时间最短
- JDK1.8默认使用的垃圾回收器
开启命令:
//命令
-XX:+UseParallelGC ~ -XX:+UseParallelOldGC
//参数
-XX:+UseAdaptiveSizePolicy
-XX:GCTimeRatio=ratio
-XX:MaxGCPauseMillis=ms
-XX:ParallelGCThreads=n
-
Parallel Scavenge 收集器
与吞吐量关系密切,故也称为吞吐量优先收集器
特点:属于新生代收集器也是采用复制算法的收集器(用到了新生代的幸存区),又是并行的多线程收集器(与ParNew收集器类似)
该收集器的目标是达到一个可控制的吞吐量。还有一个值得关注的点是:GC自适应调节策略(与ParNew收集器最重要的一个区别)
-
GC自适应调节策略:Parallel Scavenge收集器可设置
-XX:+UseAdptiveSizePolicy
参数。当开关打开时不需要手动指定新生代的大小(-Xmn)、Eden与Survivor区的比例(-XX:SurvivorRation
)、晋升老年代的对象年龄(-XX:PretenureSizeThreshold
)等,虚拟机会根据系统的运行状况收集性能监控信息,动态设置这些参数以提供最优的停顿时间和最高的吞吐量,这种调节方式称为GC的自适应调节策略。 -
Parallel Scavenge收集器使用两个参数控制吞吐量:
XX:MaxGCPauseMillis
控制最大的垃圾收集停顿时间
XX:GCRatio
直接设置吞吐量的大小
-
-
Parallel Old 收集器
是Parallel Scavenge收集器的老年代版本
特点:多线程,采用标记-整理算法(老年代没有幸存区)
4.3 响应时间优先
-
多线程
-
堆内存较大,多核CPU
-
尽可能让单次STW时间变短(尽量不影响其他线程运行)
命令:
//开启
-XX:+UseConcMarkSweepGC ~ -XX:+UseParNewGC ~ SerialOld
//参数
-XX:ParallelGCThreads=n ~ -XX:ConcGCThreads=threads
-XX:CMSInitiatingOccupancyFraction=percent
-XX:+CMSScavengeBeforeRemark
CMS 收集器
-
Concurrent Mark Sweep,一种以获取最短回收停顿时间为目标的老年代收集器
-
特点:基于标记-清除算法实现。并发收集、低停顿,但是会产生内存碎片
-
应用场景:适用于注重服务的响应速度,希望系统停顿时间最短,给用户带来更好的体验等场景下。如web程序、b/s服务
-
CMS收集器的运行过程分为下列4步:
-
初始标记:标记GC Roots能直接到的对象。速度很快但是仍存在Stop The World问题
-
并发标记:进行GC Roots Tracing 的过程,找出存活对象且用户线程可并发执行
-
重新标记:为了修正并发标记期间因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录。仍然存在Stop The World问题
-
并发清除:对标记的对象进行清除回收
CMS收集器的内存回收过程是与用户线程一起并发执行的
-
4.4 G1
4.4.1 定义
Garbage First
2004 论文发布
2009 JDK 6u14 体验
2012 JDK 7u4 官方支持
2017 JDK 9以后默认使用,而且替代了CMS 收集器
适用场景
同时注重吞吐量(Throughput)和低延迟(Low latency),默认的暂停目标是 200 ms
超大堆内存,会将堆划分为多个大小相等的 Region
整体上是 标记+整理 算法,两个区域之间是 复制 算法
相关 JVM 参数
-XX:+UseG1GC
-XX:G1HeapRegionSize=size
-XX:MaxGCPauseMillis=time
4.4.2 G1 垃圾回收阶段
新生代伊甸园垃圾回收(Young Collection)—–>内存不足,新生代回收+并发标记—–>回收新生代伊甸园、幸存区、老年代内存(Mixed Collection)——>新生代伊甸园垃圾回收(重新开始)
1. Young Collection
分区算法region
分代是按对象的生命周期划分,分区则是将堆空间划分连续几个不同小区间,每一个小区间独立回收,可以控制一次回收多少个小区间,方便控制 GC 产生的停顿时间
E:伊甸园 S:幸存区 O:老年代
会STW
![]() |
![]() |
![]() |
2. Young Collection + CM
CM:并发标记
在 Young GC 时会对 GC Root 进行初始标记
在老年代占用堆内存的比例达到阈值时,进行并发标记(不会STW),阈值由下面的 JVM 参数决定
-XX:InitiatingHeapOccupancyPercent=percent //(默认45%)
3. Mixed Collection
会对 E、S、O 进行全面垃圾回收
- 最终标记(Remark)会 STW
- 拷贝存活(Evacuation)会 STW
指定最长的停顿时间
-XX:MaxGCPauseMillis=ms
问:为什么有的老年代被拷贝了,有的没拷贝?
因为指定了最大停顿时间,如果对所有老年代都进行回收,耗时可能过高。为了保证时间不超过设定的停顿时间,会回收最有价值的老年代(回收后,能够得到更多内存)
4.4.3 Full GC
SerialGC
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足发生的垃圾收集 - full gc
ParallelGC
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足发生的垃圾收集 - full gc
CMS
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足
G1
-
新生代内存不足发生的垃圾收集 - minor gc
-
G1在老年代内存不足时(老年代所占内存超过阈值)
如果垃圾产生速度慢于垃圾回收速度,不会触发Full GC,还是并发地进行清理
如果垃圾产生速度快于垃圾回收速度,便会触发Full GC
4.4.4 Young Collection 跨代引用
-
新生代回收的跨代引用(老年代引用新生代)问题
-
卡表与 Remembered Set
Remembered Set 存在于E中,用于保存新生代对象对应的脏卡脏卡:O被划分为多个区域(一个区域512K),如果该区域引用了新生代对象,则该区域被称为脏卡
-
在引用变更时通过
post-write barrier + dirty card queue
-
concurrent refinement threads
更新Remembered Set
4.4.5 Remark
pre-write barrier + satb_mark_queue
重新标记阶段: 在垃圾回收时,收集器处理对象的过程中
黑色:已被处理,需要保留的
灰色:正在处理中的
白色:还未处理的
在并发标记过程中,有可能A被处理了以后未引用C,但该处理过程还未结束,在处理过程结束之前A引用了C,这时就会用到remark.
过程如下
- 之前C未被引用,这时A引用了C,就会给C加一个写屏障,写屏障的指令会被执行,将C放入一个队列当中,并将C变为 处理中 状态
- 在并发标记阶段结束以后,重新标记阶段会STW,然后将放在该队列中的对象重新处理,发现有强引用引用它,就会处理它
4.4.6 JDK 8u20 字符串去重
-XX:+UseStringDeduplication
优点:节省大量内存
缺点:略微多占用了 cpu 时间,新生代回收时间略微增加
过程
String s1 = new String("hello"); // char[]{'h','e','l','l','o'}
String s2 = new String("hello"); // char[]{'h','e','l','l','o'}
- 将所有新分配的字符串(底层是char[])放入一个队列
- 当新生代回收时,G1并发检查是否有重复的字符串
- 如果字符串的值一样,就让他们引用同一个字符串对象
- 注意,其与
String.intern()
的区别intern
关注的是字符串对象- 字符串去重关注的是
char[]
- 在JVM内部,使用了不同的字符串标
4.4.7 JDK 8u40 并发标记类卸载
在并发标记阶段结束以后,就能知道哪些类不再被使用。如果一个类加载器的所有类都不在使用,则卸载它所加载的所有类
-XX:+ClassUnloadingWithConcurrentMark //默认启用
4.4.8 JDK 8u60 回收巨型对象
- 一个对象大于region的一半时,就称为巨型对象
- G1不会对巨型对象进行拷贝
- 回收时被优先考虑
- G1会跟踪老年代所有incoming引用,这样老年代incoming引用为0的巨型对象就可以在新生代垃圾回收时处理掉
4.4.9 JDK 9 并发标记起始时间的调整
并发标记必须在堆空间占满前完成,否则退化为 FullGC
JDK 9 之前需要使用 -XX:InitiatingHeapOccupancyPercent
JDK 9 可以动态调整
-XX:InitiatingHeapOccupancyPercent
用来设置初始值- 进行数据采样并动态调整
- 总会添加一个安全的空档空间
5. 垃圾回收调优
查看虚拟机运行参数
"C:\Program Files\Java\jdk1.8.0_91\bin\java" -XX:+PrintFlagsFinal -version | findstr "GC"
5.1 调优领域
内存
锁竞争
cpu 占用
io
5.2 确定目标
【低延迟】还是【高吞吐量】,选择合适的回收器
- CMS,G1,ZGC
- ParallelGC
- Zing
5.3 最快的 GC是不发生 GC
查看 FullGC 前后的内存占用,考虑下面几个问题
-
数据是不是太多?
resultSet = statement.executeQuery("select * from 大表 limit n")
-
数据表示是否太臃肿?
- 对象图
- 对象大小
-
是否存在内存泄漏?
- 静态量:
static Map map =
- 软引用
- 弱引用
- 第三方缓存实现
- 静态量:
5.4 新生代调优
新生代的特点
- 所有的 new 操作的内存分配非常廉价
TLAB(thread-local allocation buffer) - 死亡对象的回收代价是零
- 大部分对象用过即死(朝生夕死)
- Minor GC 的时间远远低于 Full GC
新生代内存越大越好么? ——不是。
- 新生代内存太小:频繁触发Minor GC,会STW,会使得吞吐量下降
- 新生代内存太大:老年代内存占比有所降低,会更频繁地触发Full GC。而且触发Minor GC时,清理新生代所花费的时间会更长
理想设置
- 新生代能容纳所有【并发量 * (请求-响应)】的数据
5.5 幸存区调优
-
幸存区大到能保留【当前活跃对象+需要晋升对象】
-
晋升阈值配置得当,让长时间存活对象尽快晋升
-XX:MaxTenuringThreshold=threshold -XX:+PrintTenuringDistribution
5.6 老年代调优
以 CMS(Concurrent Mark Sweep) 为例
-
CMS 的老年代内存越大越好
-
先尝试不做调优,如果没有 Full GC 那么可不理会,否则先尝试调优新生代
-
观察发生 Full GC 时老年代内存占用,将老年代内存预设调大 1/4 ~ 1/3
-XX:CMSInitiatingOccupancyFraction=percent