JVM笔记2

最新推荐文章于 2024-10-16 10:13:45 发布

耷腊呜呜

最新推荐文章于 2024-10-16 10:13:45 发布

阅读量227

点赞数

分类专栏： JVM 文章标签： java

本文链接：https://blog.csdn.net/weixin_43976226/article/details/125675517

版权

JVM 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

8、执行引擎

执行引擎概述
Java 代码编译和执行过程
机器码、指令、汇编语言
解释器
JIT编译器

8.1 执行引擎概述

执行引擎是Java虚拟机核心的组成部分之一。
“虚拟机”是一个相对于“物理机”的概念，这两种机器都有代码执行能力，其区别是物理机的执行引擎是直接建立在处理器、缓存、指令集和操作系统层面上的，而虚拟机的执行引擎则是由软件自行实现的，因此可以不受物理条件制约地定制指令集与执行引擎的结构体系，能够执行那些不被硬件直接支持的指令集格式。
JVM的主要任务是负责装载字节码到其内部，但字节码并不能够直接运行在操作系统之上，因为字节码指令并非等价于本地机器指令，它内部包含的仅仅只是一些能够被JVM所识别的字节码指令、符号表，以及其他辅助信息。
那么，如果想要让一个Java程序运行起来，执行引擎(Execution Engine)的任务就是将字节码指令解释/编译为对应平台上的本地机器指令才可以。简单来说，JVM中的执行引擎充当了将高级语言翻译为机器语言的译者。

执行引擎的工作过程：

执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于Pc寄存器。
每当执行完一项指令操作后，Pc寄存器就会更新下一条需要被执行的指令地址。
当然方法在执行的过程中，执行引擎有可能会通过存储在局部变量表中的对象引用准确定位到存储在Java堆区中的对象实例信息，以及通过对象头中的元数据指针定位到目标对象的类型信息。

从外观上来看，所有的Java虚拟机的执行引擎输入、输出都是一致的:输入的是字节码二进制流，处理过程是字节码解析执行的等效过程，输出的是执行结果。

8.2 Java代码编译和执行的过程

大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前，都需要经过下图中的各个步骤：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hYjY7Fpr-1657251898212)(file://D:\MyCode\Typora_works\自主学习\java-JVM\img\笔记-1\2022-05-30-09-18-17-image.png?msec=1657251711965)]

Java代码编译是由Java源码编译器来完成，流程图如下所示:

在 Java 源码级编译器中，源代码 -> 词法分析器 -> Token流 ->语法树/抽象语法树 -> 语义分析器 -> 注解抽象语法树 -> 字节码生成器 -> JVM 字节码 ; 另外包括符号表

问题：什么是解释器（Interpreter），什么是 JIT 编译器

解释器:当Java虚拟机启动时会根据预定义的规范对字节码采用逐行解释的方式执行，将每条字节码文件中的内容“翻译”为对应平台的本地机器指令执行。
JIT (Just In Time Compiler)编译器:就是虚拟机将源代码直接编译成和本地机器平台相关的机器语言。

问题：为什么说 Java 是半编译半解释型语言?

DK1.0时代，将Java语言定位为“解释执行”还是比较准确的。再后来，ava也发展出可以直接生成本地代码的编译器。
现在VM在执行Java代码的时候，通常都会将解释执行与编译执行二者结合起来进行。

8.3 机器码、指令、汇编语言

机器码：

各种用二进制编码方式表示的指令，叫做机器指令码。开始，人们就用它采编写程序，这就是机器语言。
机器语言虽然能够被计算机理解和接受，但和人们的语言差别太大，不易被人们理解和记忆，并且用它编程容易出差错。
用它编写的程序一经输入计算机，CPU直接读取运行，因此和其他语言编的程序相比，执行速度最快。
机器指令与CPU紧密相关，所以不同种类的CPU所对应的机器指令也就不同。

指令：

由于机器码是有0和1组成的二进制序列，可读性实在太差，于是人们发明了指令。
指令就是把机器码中特定的o和1序列，简化成对应的指令（一般为英文简写，如mov,inc等)，可读性稍好
由于不同的硬件平台，执行同一个操作，对应的机器码可能不同，所以不同的硬件平台的同一种指令（比如mov)，对应的机器码也可能不同。

指令集：

不同的硬件平台，各自支持的指令，是有差别的。因此每个平台所支持的指令，称之为对应平台的指令集。
如常见的
- x86指令集，对应的是x86架构的平台
- ARM指令集，对应的是ARM架构的平台

汇编语言：

由于指令的可读性还是太差，于是人们又发明了汇编语言。
在汇编语言中，用助记符(Mnemonics）代替机器指令的操作码，用地址符号(Symbo1）或标号(Labe1）代替指令或操作数的地址。
在不同的硬件平台，汇编语言对应着不同的机器语言指令集，通过汇编过程转换成机器指令。
- 由于计算机只认识指令码，所以用汇编语言编写的程序还必须翻译成机器指令码，计算机才能识别和执行。

高级语言：

为了使计算机用户编程序更容易些，后来就出现了各种高级计算机语言。高级语言比机器语言、汇编语言更接近人的语言
当计算机执行高级语言编写的程序时，仍然需要把程序解释和编译成机器的指令码。完成这个过程的程序就叫做解释程序或编译程序。

总结：

高级语言 -> 汇编语言 的过程叫 编译过程

汇编语言 -> 机器指令 的过程叫 汇编过程

编译过程：是读取源程序(字符流），对之进行词法和语法的分析，将高级语言指令转换为功能等效的汇编代码

汇编过程:实际上指把汇编语言代码翻译成目标机器指令的过程。

字节码：

字节码是一种中间状态（中间码）的二进制代码（文件)，它比机器码更抽象，需要直译器转译后才能成为机器码
字节码主要为了实现特定软件运行和软件环境、与硬件环境无关。
字节码的实现方式是通过编译器和虚拟机器。编译器将源码编译成字节码，特定平台上的虚拟机器将字节码转译为可以直接执行的指令。
- 字节码的典型应用为Java bytecode。

8.4 解释器

解释器工作机制

解释器真正意义上所承担的角色就是一个运行时“翻译者”，将字节码文件中的内容“翻译”为对应平台的本地机器指令执行。
当一条字节码指令被解释执行完成后，接着再根据Pc寄存器中记录的下一条需要被执行的字节码指令执行解释操作。

在Java的发展历史里，一共有两套解释执行器，即古老的字节码解释器、现在普遍使用的模板解释器。

字节码解释器在执行时通过纯软件代码模拟字节码的执行，效率非常低下。
而模板解释器将每一条字节码和一个模板函数相关联，模板函数中直接产生这条字节码执行时的机器码，从而很大程度上提高了解释器的性能。
- 在Hotspot vM中，解释器主要由Interpreter模块和code模块构成。
  Interpreter模块:实现了解释器的核心功能
  Code模块:用于管理HotSpot VM在运行时生成的本地机器指令

8.5 JIT编译器

Java 代码的执行分类：

第一种是将源代码编译成字节码文件，然后在运行时通过解释器将字节码文件转为机器码执行
第二种是编译执行（直接编译成机器码）。现代虚拟机为了提高执行效率，会使用即时编译技术（JIT,Just In Time）将方法编译成机器码后再执行

HotSpot VM是目前市面上高性能虚拟机的代表作之一。它采用解释器与即时编译器并存的架构。在Java虚拟机运行时，解释器和即时编译器能够相互协作，各自取长补短，尽力去选择最合适的方式来权衡编译本地代码的时间和直接解释执行代码的时间。
在今天，Java程序的运行性能早已脱胎换骨，已经达到了可以和C/C++程序一较高下的地步

HotSpot JVM的执行方式：

当虚拟机启动的时候，解释器可以首先发挥作用，而不必等待即时编译器全部编译完成再执行，这样可以省去许多不必要的编译时间。并且随着程序运行时间的推移，即时编译器逐渐发挥作用，根据热点探测功能，将有价值的字节码编译为本地机器指令，以换取更高的程序执行效率。

概念解释：

Java 语言的“编译期”其实是一段“不确定”的操作过程，因为它可能是指一个前端编译器（其实叫“编译器的前端”更准确一些)把 .java文件转变
成.class文件的过程;
也可能是指虚拟机的后端运行期编译器（JIT编译器，Just In Time Compiler)把字节码转变成机器码的过程。
还可能是指使用静态提前编译器(AOT编译器，Ahead of Time Compiler）直接把.java文件编译成本地机器代码的过程。

热点代码及探测方式：

当然是否需要启动JIT编译器将字节码直接编译为对应平台的本地机器指令，则需要根据代码被调用执行的频率而定。关于那些需要被编译为本地代码的字节码，也被称之为“热点代码”，JIT编译器在运行时会针对那些频繁被调用的“热点代码”做出深度优化，将其直接编译为对应平台的本地机器指令，以此提升Java程序的执行性能。

一个被多次调用的方法，或者是一个方法体内部循环次数较多的循环体都可以被称之为“热点代码”，因此都可以通过JIT编译器编译为本地机器指令。由于这种编译方式发生在方法的执行过程中，因此也被称之为栈上替换，或简称为oSR (On StackReplacement)编译。
一个方法究竟要被调用多少次，或者一个循环体究竟需要执行多少次循环才可以达到这个标准?必然需要一个明确的阙值，JIT编译器才会将这些“热点代码”编译为本地机器指令执行。这里主要依靠热点探测功能。
目前HotSpot VM所采用的热点探测方式是基于计数器的热点探测。
采用基于计数器的热点探测，HotSpot VM将会为每一个方法都建立2个不同类型的计数器，分别为方法调用计数器(Invocation Counter）和回边计数器（Back
Edge Counter) .
- 方法调用计数器用于统计方法的调用次数
- 回边计数器则用于统计循环体执行的循环次数

方法调用计数器：

这个计数器就用于统计方法被调用的次数，它的默认阈值在 client模式下是 1500 次，在 Server模式下是 10000 次。超过这个阈值，就会触发JIT编译。
这个阈值可以通过虚拟机参数-xx : compileThreshold来人为设定。
当一个方法被调用时，会先检查该方法是否存在被JIT编译过的版本，如果存在，则优先使用编译后的本地代码来执行。如果不存在已被编译过的版本，则将此方法的调用计数器值加1，然后判断方法调用计数器与回边计数器值之和是否超过方法调用计数器的阀值。如果已超过阈值，那么将会向即时编译器提交一个该方法的代码编译请求。

热度衰减：

如果不做任何设置，方法调用计数器统计的并不是方法被调用的绝对次数，而是一个相对的执行频率，即一段时间之内方法被调用的次数。当超过一定的时间限度，如果方法的调用次数仍然不足以让它提交给即时编译器编译，那这个方法的调用计数器就会被减少一半，这个过程称为方法调用计数器热度的衰减(Counter Decay)，而这段时间就称为此方法统计的半衰周期(counter Half Life Time)。
进行热度衰减的动作是在虚拟机进行垃圾收集时顺便进行的，可以使用虚拟机参数-xX:-UseCounterDecay来关闭热度衰减，让方法计数器统计方法调用的绝对次数，这样，只要系统运行时间足够长，绝大部分方法都会被编译成本地代码。
另外，可以使用-xX:CounterHalfLifeTime参数设置半衰周期的时间，单位是秒。

回边计数器：

它的作用是统计一个方法中循环体代码执行的次数，在字节码中遇到控制流向后跳转的指令称为“回边”(Back Edge)。显然，建立回边计数器统计的目的就是为了触发OSR编译。

HotSpot VM可以设置程序执行方式：

缺省情况下HotSpot VM是采用解释器与即时编译器并存的架构，当然开发人员可以根据具体的应用场景，通过命令显式地为Java虚拟机指定在运行时到底是完全采用解释器执行，还是完全采用即时编译器执行。如下所示:

-Xint:完全采用解释器模式执行程序;
-Xcomp:完全采用即时编译器模式执行程序。如果即时编译出现问题，解释器会介入执行。
-Xmixed:采用解释器+即时编译器的混合模式共同执行程序。

HotSpot VM 中 JIT分类：

在HotSpot VM中内嵌有两个JIT编译器，分别为client Compiler和server Compiler，但大多数情况下我们简称为c1编译器和c2编译器。开发人员可以通过如下命令显式指定Java虚拟机在运行时到底使用哪一种即时编译器，如下所示:

-client:指定Java虚拟机运行在client模式下，并使用c1编译器;
c1编译器会对字节码进行简单和可靠的优化，耗时短。以达到更快的编译速度。
-server:指定Java虚拟机运行在Server模式下，并使用C2编译器。
C2进行耗时较长的优化，以及激进优化。但优化的代码执行效率更高。

C1和C2编译器不同的优化策略∶

在不同的编译器上有不同的优化策略，c1编译器上主要有方法内联，去虚拟化、冗余消除。
- 方法内联:将引用的函数代码编译到引用点处，这样可以减少栈帧的生成，减
  少参数传递以及跳转过程
- 去虚拟化:对唯一的实现类进行内联
- 冗余消除:在运行期间把一些不会执行的代码折叠掉
c2的优化主要是在全局层面，逃逸分析是优化的基础。基于逃逸分析在c2上有如下几种优化:
- 标量替换:用标量值代替聚合对象的属性值
- 栈上分配:对于未逃逸的对象分配对象在栈而不是堆
- 同步消除:清除同步操作，通常指synchronized

分层编译(Tiered compilation）策略:程序解释执行（不开启性能监控）可以触发cl编译，将字节码编译成机器码，可以进行简单优化，也可以加上性能监控，C2编译会根据性能监控信息进行激进优化。

不过在Java7版本之后，一但开发人员在程序中显式指定命令“-server"时，默认将会开启分层编译策略，由c1编译器和c2编译器相互协作共同来执行编译任务。

总结:

一般来讲，JIT编译出来的机器码性能比解释器高。
C2编译器启动时长比C1编译器慢，系统稳定执行以后，c2编译器执行速度远远快于c1编译器。

9、StringTable

String的基本特性
String 的内存分配
String 的基本操作
字符串拼接操作
intern() 的使用
StringTable 的垃圾回收
G1 中的String 去重操作

9.1 String的基本特性

string:字符串，使用一对""引起来表示。
string声明为final的，不可被继承
string实现了serializable接口:表示字符串是支持序列化的。
实现了comparable接口:表示string可以比较大小
string在jdk8及以前内部定义了final char[] value用于存储字符串数据。jdk9时改为byte[]

结论：String再也不用char[]来存储啦，改成了byte[]加上编码标记，节约了一些空间。

string :代表不可变的字符序列。简称:不可变性。
- 当对字符串重新赋值时，需要重写指定内存区域赋值，不能使用原有
  的value进行赋值。
- 当对现有的字符串进行连接操作时，也需要重新指定内存区域赋值，
  不能使用原有的value进行赋值。
- 当调用string的replace ()方法修改指定字符或字符串时，也需要
  重新指定内存区域赋值，不能使用原有的value进行赋值。
通过字面量的方式(区别于new）给一个字符串赋值，此时的字符串值声明在字符串常量池中。

此时成员变量和局部变量指向的地址就不一样了

而局部变量str如果不重新赋值的话也是和成员变量str指向同一个地址，一但重新辅助，因为String的不可变性，就会重新开辟一个内存空间。

字符串常量池中是不会存储相同内容的字符串的。
String的String Pool是一个固定大小的Hashtable，默认值大小长度是1009。如果放进string Pool的string非常多，就会造成Hash冲突严重，从而导致链表会很长，而链表长了后直接会造成的影响就是当调用string.intern时性能会大幅下降。
使用-XX :StringTableSize可设置StringTable的长度
在jdk6中StringTable是固定的，就是1009的长度，所以如果常量池中的字符串过多就会导致效率下降很快。StringTableSize设置没有要求
在jdk7中，StringTable的长度默认值是60013，StringTableSize 设置没有要求
JDK8开始，设置StringTable的长度的话，1009是可设置的最小值。

9.2 String 的内存分配

在Java语言中有8种基本数据类型和一种比较特殊的类型string。这些类型为了使它们在运行过程中速度更快、更节省内存，都提供了一种常量池的概念。
常量池就类似一个Java系统级别提供的缓存。8种基本数据类型的常量池都是系统协调的，string类型的常量池比较特殊。它的主要使用方法有两种。
- 直接使用双引号声明出来的string对象会直接存储在常量池中。
  - 比如:string info = “atguigu . com” ;
- 如果不是用双引号声明的string对象，可以使用string提供的
  intern ()方法。这个后面重点谈
Java 6及以前，字符串常量池存放在永久代。
Java 7 中 oracle 的工程师对字符串池的逻辑做了很大的改变，即将字符串常量池的位置调整到Java堆内。
- 所有的字符串都保存在堆（Heap）中，和其他普通对象一样，这样
  可以让你在进行调优应用时仅需要调整堆大小就可以了。
- 字符串常量池概念原本使用得比较多，但是这个改动使得我们有足够的理由让我们重新考虑在Java 7 中使用string.intern ( )。
Java8元空间，字符串常量在堆

StringTable为什么要调整

1、permSize默认比较少 2、永久代垃圾回收频率低

9.3 String 的基本操作

9.4 字符串拼接操作

1.常量与常量的拼接结果在常量池，原理是编译期优化

2.常量池中不会存在相同内容的常量。

3.只要其中有一个是变量，结果就在堆中。变量拼接的原理是stringBuilder

4.如果拼接的结果调用intern ()方法，则主动将常量池中还没有的字符串对象放入池中，并返回此对象地址。

9.5 intern()的使用

如果不是用双引号声明的string对象，可以使用string提供的intern方法: intern方法会从字符串常量池中查询当前字符串是否存在，若不存在就会将当前字符串放入常量池中。
- 比如:string myInfo = new string(“I love atguigu” ) .intern();
也就是说，如果在任意字符串上调用string.intern方法，那么其返回结果所指向的那个类实例，必须和直接以常量形式出现的字符串实例完全相同。因此，下列表达式的值必定是true:
( " a" +“b” +“c”) .intern () – “abc”
通俗点讲，Interned string就是确保字符串在内存里只有一份拷贝，这样可以节约内存空间，加快字符串操作任务的执行速度。注意，这个值会被存放在字符串内部池(string Intern Pool) 。.

总结string的intern ()的使用:

jdk1.6中，将这个字符串对象尝试放入串池。
- 如果串池中有，则并不会放入。返回已有的串池中的对象的地址
- 如果没有，会把此对象复制一份，放入串池，并返回串池中的对象地址
Jdk1.7起，将这个字符串对象尝试放入串池。
- 如果串池中有，则并不会放入。返回已有的串池中的对象的地址
- 如果没有，则会把对象的引用地址复制一份，放入串池，并返回串池中的引用地址

9.6 StringTable 的垃圾回收

9.7 G1 中的String 去重操作

背景:对许多Java应用（有大的也有小的）做的测试得出以下结果:
- 堆存活数据集合里面string对象占了25%
- 堆存活数据集合里面重复的String对象有13.5%
- String对象的平均长度是45
许多大规模的Java应用的瓶颈在于内存，测试表明，在这些类型的应用里面，Java堆中存活的数据集合差不多25%是string对象。更进一步，这里面差不多一半string对象是重复的，重复的意思是说:
string1.equals(string2 ) =true。堆上存在重复的string对象必然是一种内存的浪费。这个项目将在G1垃圾收集器中实现自动持续对重复的string对象进行去重，这样就能避免浪费内存。
实现
- 当垃圾收集器工作的时候，会访问堆上存活的对象。对每一个访问的对象都会
  检查是否是候选的要去重的string对象。
- 如果是，把这个对象的一个引用插入到队列中等待后续的处理。一个去重的线
  程在后台运行，·处理这个队列,处理队列的十个元素意味着从队列删除这个元素，然后尝试去重它引用的string对象。
- 使用一个hashtable来记录所有的被string对象使用的不重复的char数组。
  当去重的时候，会查这个hashtable，来看堆上是否已经存在一个一模一样的char数组。
- 如果存在，string对象会被调整引用那个数组，释放对原来的数组的引用，最
  终会被垃圾收集器回收掉。
- 如果查找失败，char数组会被插入到hashtable，这样以后的时候就可以共
  享这个数组了。

命令行选项：

UsestringDeduplication (bool):开启string去重，默认是不开启的，需要手动开启。
PrintstringDeduplicationstatistics (bool) :打印详细的去重统计信息
stringDeduplicationAgeThreshold (uintx):达到这个年龄的string对象被认为是去重的候选对象

10、垃圾回收概述

10.1 什么是垃圾

垃圾收集，不是Java语言的伴生产物。早在1960年，第一门开始使用内存动态分配和垃圾收集技术的Lisp语言诞生。
关于垃圾收集有三个经典问题:
- 哪些内存需要回收?
- 什么时候回收?
- 如何回收?
垃圾收集机制是Java的招牌能力，极大地提高了开发效率。如今，垃圾收集几乎成为现代语言的标配，即使经过如此长时间的发展，Java的垃圾收集机制仍然在不断的演进中，不同大小的设备、不同特征的应用场景，对垃圾收集提出了新的挑战，这当然也是面试的热点。

拓展：大厂面试题

蚂蚁金服;

你知道哪几种垃圾回收器，各自的优缺点，重点讲一下cms和g1
一面:JVM Gc算法有哪些，目前的JDK版本采用什么回收算法
—面:G1回收器讲下回收过程
Gc是什么?为什么要有GC?|
一面:GC 的两种判定方法?CMS收集器与G1 收集器的特点。

百度:
说一下GC算法，分代回收说下垃圾收集策略和算法

天猫:
一面: jvm Gc原理，JVM怎么回收内存
一面: cMs特点，垃圾回收算法有哪些?各自的优缺点，他们共同的缺点是什么?

滴滴:
一面: java的垃圾回收器都有哪些，说下g1的应用场景，平时你是如何搭配使用垃圾回收器的

京东:
你知道哪几种垃圾收集器，各自的优缺点，重点讲下cms和G1，包括原理，流程，优缺点。垃圾回收算法的实现原理。
阿里:
讲一讲垃圾回收算法。
什么情况下触发垃圾回收?
如何选择合适的垃圾收集算法?
JVM有哪三种垃圾回收器?

字节跳动;
常见的垃圾回收器算法有哪些，各有什么优劣?
system.gc(和runtime.gc()会做什么事情
一面: Java Gc机制?GC Roots有哪些?
二面: Java对象的回收方式，回收算法。
CMS和G1了解么，CMS解决什么问题，说一下回收的过程。
CMS回收停顿了几次,为什么要停顿两次。

什么是垃圾( Garbage)呢?
位圾是指在运行程序中没有任何指针指向的对象，这个对象就是需要被回收的垃圾。
外文: An object is considered garbage when it can nolonger be reached from any pointer in the runningprogram.
如果不及时对内存中的垃圾进行清理，那么，这些垃圾对象所占的内存空间会一直保留到应用程序结束，被保留的空间无法被其他对象使用。甚至可能导致内存溢出。

10.2 为什么需要GC

对于高级语言来说，一个基本认知是如果不进行垃圾回收，内存迟早都会被消耗完,
因为不断地分配内存空间而不进行回收，就好像不停地生产生活垃圾而从来不打扫—样。
除了释放没用的对象，垃圾回收也可以清除内存里的记录碎片。碎片整理将所占用的堆内存移到堆的一端，以便JVM将整理出的内存分配给新的对象。
随着应用程序所应付的业务越来越庞大、复杂，用户越来越多，没有GC就不能保证应用程序的正常进行。而经常造成STw的Gc又跟不上实际的需求，所以才会不断地尝试对Gc进行优化。

10.3 早期垃圾回收

在早期的C/C++时代，拉圾回收基本上是手工进行的。开发人员可以使用new关键字进行内存申请，并使用delete关键字进行内存释放。比如以下代码:

MibBridge *pBridge = new cmBaseGroupBridge ( ) ;
//如果注册失败，使用Delete释放该对象所占内存区域
if(pBridge->Register ( kDestroy) != NO_ERROR)
delete pBridge;

这种方式可以灵活控制内存释放的时间，但是会给开发人员带来频繁申请和释放内存的管理负担。倘若有一处内存区间由于程序员编码的问题忘记被回收，那么就会产生内存泄漏，垃圾对象永远无法被清除，随着系统运行时间的不断增长，垃圾对象所耗内存可能持续上升，直到出现内存溢出并造成应用程序崩溃

在有了垃圾回收机制后，上述代码块极有可能变成这样:
MibBridge *pBridge = new cmBaseGroupBridge ( ) ;pBridge->Register ( kDestroy );
现在，除了Java以外，C#、Python、 Ruby等语言都使用了自动垃圾回收的思想，也是未来发展趋势。可以说，这种自动化的内存分配和垃圾回收的方式己经成为现代开发语言必备的标准。

10.4 Java垃圾回收机制

自动内存管理,无需开发人员手动参与内存的分配与回收，这样降低内存泄漏和内存溢出的风险
- 没有垃圾回收器，java也会和cpp一样，各种悬垂指针，野指针，泄露问题
  让你头疼不已。
自动内存管理机制，将程序员从繁重的内存管理中释放出来，可以更专心地专注于业务开发
oracle官网关于垃圾回收的介绍
https: / / docs.oracle.com/javase/8/docs/technotes/guides/
vm/gctuning/toc.html
对于Java开发人员而言，自动内存管理就像是一个黑匣子，如果过度依赖于“自动”，那么这将会是一场灾难，最严重的就会弱化Java开发人员在程序出现内存溢出时定位问题和解决问题的能力。
此时，了解JVM的自动内存分配和内存回收原理就显得非常重要，只有在真正了解JVM是如何管理内存后，我们才能够在遇见outofMemoryError时，快速地根据错误异常日志定位问题和解决问题。
当需要排查各种内存溢出、内存泄漏问题时，当垃圾收集成为系统达到更高并发量的瓶颈时，我们就必须对这些“自动化”的技术实施必要的监控和调节。

垃圾回收器可以对年轻代回收，也可以对老年代回收，甚至是全堆和方法区的回收。
- 其中，Java堆是垃圾收集器的工作重点。
从次数上讲:
- 频繁收集Young区
- 较少收集o1d区
- 基本不动Perm区(或元空间 )

11、垃圾回收相关算法

对象存活判断

在堆里存放着几乎所有的Java对象实例，在GC执行垃圾回收之前，首先需要区分出内存中哪些是存活对象，哪些是已经死亡的对象。只有被标记为己经死亡的对象，Gc才会在执行垃圾回收时，释放掉其所占用的内存空间，因此这个过程我们可以称为垃圾标记阶段。
那么在JVM中究竟是如何标记一个死亡对象呢?简单来说，当一个对象已经不再被任何的存活对象继续引用时，就可以宣判为已经死亡。
判断对象存活一般有两种方式:引用计数算法和可达性分析算法。

11.1 标记阶段：引用计数算法

引用计数算法(Reference Counting)比较简单，对每个对象保存一个整型的引用
计数器属性。用于记录对象被引用的情况。
对于一个对象A，只要有任何一个对象引用了A，则A的引用计数器就加1;当引用失效
时，引用计数器就减1。只要对象A的引用计数器的值为0，即表示对象A不可能再被使用，可进行回收。
优点:实现简单，垃圾对象便于辨识;判定效率高，回收没有延迟性。
缺点:
- 它需要单独的字段存储计数器，这样的做法增加了存储空间的开销。
- 每次赋值都需要更新计数器，伴随着加法和减法操作，这增加了时间开销。
- 引用计数器有一个严重的问题，即无法处理循环引用的情况。这是一条致命缺陷,
  导致在Java的垃圾回收器中没有使用这类算法。
引用计数算法，是很多语言的资源回收选择，例如因人工智能而更加火热
的Python，它更是同时支持引用计数和垃圾收集机制。
具体哪种最优是要看场景的，业界有大规模实践中仅保留引用计数机制，
以提高吞吐量的尝试。
Java并没有选择引用计数，是因为其存在一个基本的难题，也就是很难处
理循环引用关系。
Python如何解决循环引用?
- 手动解除:很好理解，就是在合适的时机，解除引用关系。
- 使用弱引用weakref， weakref是Python提供的标准库，旨在解
  决循环引用。

11.2 标记阶段：可达性分析算法

相对于引用计数算法而言，可达性分析算法不仅同样具备实现简单和执行高效等特点，更重要的是该算法可以有效地解决在引用计数算法中循环引用的问题，防止内存泄漏的发生。
相较于引用计数算法，这里的可达性分析就是Java、C#选择的。这种类型的垃圾收集通常也叫作追踪性垃圾收集（Tracing Garbage Collection) 。
所谓"GC Roots"根集合就是一组必须活跃的引用。
基本思路:
- 可达性分析算法是以根对象集合(GC Roots)为起始点，按照从上至下
  的方式搜索被根对象集合所连接的目标对象是否可达。
- 使用可达性分析算法后，内存中的存活对象都会被根对象集合直接或间
  接连接着，搜索所走过的路径称为引用链(Reference Chain)
- 如果目标对象没有任何引用链相连，则是不可达的，就意味着该对象己经死亡，可以标记为垃圾对象。
- 在可达性分析算法中，只有能够被根对象集合直接或者间接连接的对象
  才是存活对象。

GC Roots

在 Java 语言中，GC Roots 包括以下几类元素：

虚拟机栈中引用的对象
- 比如:各个线程被调用的方法中使用到的参数、局部变量等。
本地方法栈内JNI(通常说的本地方法)引用的对象
方法区中类静态属性引用的对象
- 比如: Java类的引用类型静态变量
方法区中常量引用的对象
- 比如:字符串常量池(string Table）里的引用
所有被同步锁synchronied持有的对象
Java虚拟机内部的引用。
- 基本数据类型对应的class对象，一些常驻的异常对象（如:
  NullPointerException、outofMemoryError），系统类加载器。
反映java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。
除了这些固定的GC Roots集合以外，根据用户所选用的垃圾收集器以及当前回收的内存区域不同，还可以有其他对象“临时性”地加入，共同构成完整GC Roots集合。比如:分代收集和局部回收(Partial GC）。
- 如果只针对Java堆中的某一块区域进行垃圾回收（比如:典型的只针
  对新生代），必须考虑到内存区域是虚拟机自己的实现细节，更不是孤立封闭的，这个区域的对象完全有可能被其他区域的对象所引用，这时候就需要一并将关联的区域对象也加入GC Roots集合中去考虑，才能保证可达性分析的准确性。
小技巧：
- 由于Root 采用栈方式存放变量和指针，所以如果一个指针，它保存了堆内存里面的对象，但是自己又不存放在堆内存里面，那它就是一个Root
如果要使用可达性分析算法来判断内存是否可回收，那么分析工作必须在一个能保障一致性的快照中进行。这点不满足的话分析结果的准确性就无法保证。
这点也是导致Gc进行时必须"stop The world"的一个重要原因。
- 即使是号称（几乎）不会发生停顿的cMS收集器中，枚举根节点时
  也是必须要停顿的。

11.3 对象的 finalization 机制

Java语言提供了对象终止(finalization）机制来允许开发人员提供对象被销毁之前的自定义处理逻辑。
当垃圾回收器发现没有引用指向一个对象，即:垃圾回收此对象之前，总会先调用这个对象的finalize ()方法。
finalize()方法允许在子类中被重写，用于在对象被回收时进行资源释放。通常在这个方法中进行一些资源释放和清理的工作，比如关闭文件、套接字和数据库连接等。
永远不要主动调用某个对象的finalize()方法，应该交给垃圾回收机制调用。理由包括下面三点:
- 在finalize ()时可能会导致对象复活。
- finalize ()方法的执行时间是没有保障的，它完全由GC线程决定，极端情况下，若不发生Gc，则finalize ()方法将没有执行机会。
- 一个糟糕的finalize()会严重影响Gc的性能。
从功能上来说，finalize ()方法与C++中的析构函数比较相似，但是Java采用的是基于垃圾回收器的自动内存管理机制，所以finalize()方法在本质上不同于C++中的析构函数。
由于finalize ()方法的存在，虚拟机中的对象一般处于三种可能的状态。

生存还是死亡？

如果从所有的根节点都无法访问到某个对象，说明对象己经不再使用了。一般来说，此对象需要被回收。但事实上，也并非是“非死不可”的，这时候它们暂时处于“缓刑”阶段。一个无法触及的对象有可能在某一个条件下“复活”自己，如果这样，那么对它的回收就是不合理的，为此，定义虚拟机中的对象可能的三种状态。如下:
- 可触及的:从根节点开始，可以到达这个对象。
- 可复活的:对象的所有引用都被释放，但是对象有可能在finalize ()中复活。
- 不可触及的:对象的finalize()被调用，并且没有复活，那么就会进入不可触
  及状态。不可触及的对象不可能被复活，因为finalize()只会被调用一次。
以上3种状态中，是由于finalize ()方法的存在，进行的区分。只有在对象不可触及时才可以被回收。

具体过程：

判定一个对象objA是否可回收，至少要经历两次标记过程:
1．如果对象objA到GC Roots没有引用链，则进行第一次标记。
2．进行筛选，判断此对象是否有必要执行finalize ()方法
- 如果对象objA没有重写finalize()方法，或者finalize ()方法已经被虚拟机调用过，
  则虚拟机视为“没有必要执行”，objA被判定为不可触及的。
- 如果对象objA重写了finalize()方法，且还未执行过，那么objA会被插入到F-Queue
  队列中，由一个虚拟机自动创建的、低优先级的Finalizer线程触发其finalize ()方法执行。
- finalize()方法是对象逃脱死亡的最后机会，稍后cc会对F-Queue队列中的对象进行
  第二次标记。如果objA在finalize()方法中与引用链上的任何一个对象建立了联系，那么在第二次标记时，objA会被移出“即将回收”集合。之后，对象会再次出现没有引用存在的情况。在这个情况下，finalize方法不会被再次调用，对象会直接变成不可触及的状态，也就是说，一个对象的finalize方法只会被调用一次。

11.4 MAT与JProfiler的GC Roots朔源

11.5 清除阶段：标记-清除算法

垃圾清除阶段：

当成功区分出内存中存活对象和死亡对象后，GC接下来的任务就是执行垃圾回收，释放掉无用对象所占用的内存空间，以便有足够的可用内存空间为新对象分配内存。
目前在JVM中比较常见的三种垃圾收集算法是标记一清除算法（ Mark-Sweep )、复制算法( copying )、标记–压缩算法（Mark-Compact ) 。

背景:

标记–清除算法( Mark-Sweep )是一种非常基础和常见的垃圾收集算法，该算法被J.McCarthy等人在1960年提出并并应用于Lisp语言。

执行过程:
当堆中的有效内存空间（available memory）被耗尽的时候，就会停止整个程序（也被称为stop the world)，然后进行两项工作，第一项则是标记，第二项则是清除。

标记:collector从引用根节点开始遍历，标记所有被引用的对象。一般是在对象的Header中记录为可达对象。
清除:collector对堆内存从头到尾进行线性的遍历，如果发现某个对象在其Header中没有标记为可达对象，则将其回收。

缺点

效率不算高
在进行cc的时候，需要停止整个应用程序，导致用户体验差
这种方式清理出来的空闲内存是不连续的，产生内存碎片。需要维护一个空闲列表

注意∶何为清除?

这里所谓的清除并不是真的置空，而是把需要清除的对象地址保存在空闲的地址列表里。下次有新对象需要加载时，判断垃圾的位置空间是否够，如果够，就存放。

11.6 清除阶段：复制算法

背景:
为了解决标记-清除算法在垃圾收集效率方面的缺陷，M.L.Minsky于1963年发表了著名的论文，“使用双存储区的Lisp语言垃圾收集器cALISP Garbage collector Algorithm Using serial
Secondary storage ) ”。M.L.Minsky在该论文中描述的算法被人们称为复制(copying）算法，它也被M.L.Minsky本人成功地引入到了Lisp语言的一个实现版本中。

核心思想:
将活着的内存空间分为两块，每次只使用其中一块，在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中，之后清除正在使用的内存块中的所有对象，交换两个内存的角色，最后完成垃圾回收。

优点:

没有标记和清除过程，实现简单，运行高效
复制过去以后保证空间的连续性，不会出现“碎片”问题。

缺点:

此算法的缺点也是很明显的，就是需要两倍的内存空间。
对于G1这种分拆成为大量region的Gc，复制而不是移动，意味着cc需要维护region之间对象引用关系，不管是内存占用或者时间开销也不小。

特别的:

如果系统中的垃圾对象很多，复制算法需要复制的存活对象数量并不会太大，
或者说非常低才行。

11.7 清除阶段：标记-压缩算法

背景:

复制算法的高效性是建立在存活对象少、垃圾对象多的前提下的。这种情况在新生代经常发生，但是在老年代，更常见的情况是大部分对象都是存活对象。如果依然使用复制算法，由于存活对象较多，复制的成本也将很高。因此，基于老年代垃圾回收的特性，需要使用其他的算法。
标记 - 清除算法的确可以应用在老年代中，但是该算法不仅执行效率低下，而且在执行完内存回收后还会产生内存碎片，所以JVM的设计者需要在此基础之上进行改进。标记–压缩（Mark - compact）算法由此诞生。
1970年前后，G. L. steele .c. J. Chene 和D.s. wise 等研究者发布标记-压缩算法。在许多现代的垃圾收集器中，人们都使用了标记-压缩算法或其改进版本。

执行过程：

第一阶段和标记清除算法一样,从根节点开始标记所有被引用对象
第二阶段将所有的存活对象压缩到内存的一端，按顺序排放。之后，清理边界外所有的空间。

标记-压缩算法的最终效果等同于标记-清除算法执行完成后，再进行一次内存碎片整理，因此，也可以把它称为标记-清除-压缩(Mark-Sweep-Compact)算法。
二者的本质差异在于标记-清除算法是一种非移动式的回收算法，标记-压缩是移动式的。是否移动回收后的存活对象是一项优缺点并存的风险决策。
可以看到，标记的存活对象将会被整理，按照内存地址依次排列，而未被标记的内存会被清理掉。如此一来，当我们需要给新对象分配内存时，JVM只需要持有一个内存的起始地址即可，这比维护一个空闲列表显然少了许多开销。

指针碰撞：

如果内存空间以规整和有序的方式分布，即已用和未用的内存都各自一边，彼此之间维系着一个记录下一次分配起始点的标记指针，当为新对象分配内存时,只需要通过修改指针的偏移量将新对象分配在第一个空闲内存位置上，这种分配方式就叫做指针碰撞（Bump the Pointer）。

优点:

消除了标记-清除算法当中，内存区域分散的缺点，我们需要给新对象分配
内存时，JVM只需要持有一个内存的起始地址即可。
消除了复制算法当中，内存减半的高额代价。

缺点:

从效率上来说，标记-整理算法要低于复制算法。
移动对象的同时，如果对象被其他对象引用，则还需要调整引用的地址。·移动过程中，需要全程暂停用户应用程序。即:STw

11.8 小结

	Mark-Sweep	Mark-Compact	Copying
速度	中等	最慢	最快
空间开销	少（会堆积碎片）	少（不堆积碎片）	通常需要活对象的2倍大小
移动对象	否	是	是

效率上来说，复制算法是当之无愧的老大，但是却浪费了太多内存。
而为了尽量兼顾上面提到的三个指标，标记-整理算法相对来说更平滑一些，但是效率上不尽如人意，它比复制算法多了一个标记的阶段，比标记-清除多了一个整理内存的阶段。

11.9 分代收集算法

前面所有这些算法中，并没有一种算法可以完全替代其他算法，它们都具有自己独特的优势和特点。分代收集算法应运而生。
分代收集算法，是基于这样一个事实:不同的对象的生命周期是不一样的。因此，不同生命周期的对象可以采取不同的收集方式，以便提高回收效率。一般是把Java堆分为新生代和老年代，这样就可以根据各个年代的特点使用不同的回收算法，以提高垃圾回收的效率。
在Java程序运行的过程中，会产生大量的对象，其中有些对象是与业务信息相关，比如Http请求中的session对象、线程、socket连接，这类对象跟业务直接挂钩，因此生命周期比较长。但是还有一些对象，主要是程序运行过程中生成的临时变量，这些对象生命周期会比较短，比如: string对象，由于其不变类的特性，系统会产生大量的这些对象，有些对象甚至只用一次即可回收。

目前几乎所有的gc都是采用分代收集(Generational collecting)算法执行垃圾回收的。

年轻代(Young Gen)

年轻代特点:区域相对老年代较小，对象生命周期短、存活率低，回收频繁。
这种情况复制算法的回收整理，速度是最快的。复制算法的效率只和当前存活对象大小有关，因此很适用于年轻代的回收。而复制算法内存利用率不高的问题，通过hotspot中的两个survivor的设计得到缓解。

老年代(Tenured Gen)

老年代特点:区域较大，对象生命周期长、存活率高，回收不及年轻代频繁。
这种情况存在大量存活率高的对象，复制算法明显变得不合适。一般是由标记-清除或者是标记-清除与标记-整理的混合实现。
- Mark阶段的开销与存活对象的数量成正比。
- Sweep阶段的开销与所管理区域的大小成正相关。
- compact阶段的开销与存活对象的数据成正比。

以HotSpot中的cMs回收器为例，CMS是基于Mark-Sweep实现的，对于对象的回收效率很高。而对于碎片问题，cMs采用基于Mark-Compact算法的serial old回收器作为补偿措施:当内存回收不佳（碎片导致的Concurrent Mode Failure时)，将采用serial old执行Full cc以达到对老年代内存的整理。
分代的思想被现有的虚拟机广泛使用。几乎所有的垃圾回收器都区分新生代和老年代。

11.10 增量收集算法、分区算法

上述现有的算法，在垃圾回收过程中，应用软件将处于一种stop the world的状态。在stop the world状态下，应用程序所有的线程都会挂起，暂停一切正常的工作，等待垃圾回收的完成。如果垃圾回收时间过长，应用程序会被挂起很久，将严重影响用户体验或者系统的稳定性。为了解决这个问题，即对实时垃圾收集算法的研究直接导致了增量收集(Incremental collecting）算法的诞生。

基本思想

如果一次性将所有的垃圾进行处理，需要造成系统长时间的停顿，那么就可以让垃圾收集线程和应用程序线程交替执行。每次，垃圾收集线程只收集一小片区域的内存空间，接着切换到应用程序线程。依次反复，直到垃圾收集完成。
总的来说，增量收集算法的基础仍是传统的标记-清除和复制算法。增量收集算法通过对线程间冲突的妥善处理，允许垃圾收集线程以分阶段的方式完成标记、清理或复制工作。

缺点:
使用这种方式，由于在垃圾回收过程中，间断性地还执行了应用程序代码，所以能减少系统的停顿时间。但是，因为线程切换和上下文转换的消耗，会使得垃圾回收的总体成本上升，造成系统吞吐量的下降。

分区算法：

一般来说，在相同条件下，堆空间越大，一次Gc时所需要的时间就越长，有关Gc产生的停顿也越长。为了更好地控制cc产生的停顿时间，将一块大的内存区域分割成多个小块，根据目标的停顿时间，每次合理地回收若干个小区间，而不是整个堆空间，从而减少一次Gc所产生的停顿。
分代算法将按照对象的生命周期长短划分成两个部分，分区算法将整个堆空间划分成连续的不同小区间region。
每一个小区间都独立使用，独立回收。这种算法的好处是可以控制一次回收多少个小区间。

12 垃圾回收相关概念

12.1 System.gc()的理解

在默认情况下，通过system.gc()或者Runtime.getRuntime ( ).gc ()的调用，会显式触发Full Gc，同时对老年代和新生代进行回收，尝试释放被丢弃对象占用的内存。
然而system.gc()调用附带一个免责声明，无法保证对垃圾收集器的调用。
JVM实现者可以通过system.gc ()调用来决定JVM的Gc行为。而一般情况下，垃圾回收应该是自动进行的，无须手动触发，否则就太过于麻烦了。在一些特殊情况下，如我们正在编写一个性能基准，我们可以在运行之间调用system.gc ( )。

12.2 内存溢出与内存泄漏

内存溢出：

内存溢出相对于内存泄漏来说，尽管更容易被理解，但是同样的，内存溢出也是引发程序崩溃的罪魁祸首之一。
由于Gc一直在发展，所有一般情况下，除非应用程序占用的内存增长速度非常快，造成垃圾回收已经跟不上内存消耗的速度，否则不太容易出现ooM的情况。
大多数情况下，Gc会进行各种年龄段的垃圾回收，实在不行了就放大招，来一次独占式的Full Gc操作，这时候会回收大量的内存，供应用程序继续使用。
javadoc中对outOfMemoryError的解释是，没有空闲内存，并且垃圾收集器也无法提供更多内存。

首先说没有空闲内存的情况:说明Java虚拟机的堆内存不够。

原因有二：

(1) Java虚拟机的堆内存设置不够。
比如:可能存在内存泄漏问题;也很存可能就是堆的大小不合理，比如我们要处理比较可观的数据量，但是没有显式指定JM堆大小或者指定数值偏小。我们可以通过参数-xms.-Xmx来调整。
(2）代码中创建了大量大对象，并且长时间不能被垃圾收集器收集（存在被引用)对于老版本的oracle JDK，因为永久代的大小是有限的，并且JVM对永久代垃圾回收(如，常量池回收、卸载不再需要的类型）非常不积极，所以当我们不断添加新类型的时候，永久代出现outofMemoryError也非常多见，尤其是在运行时存在大量动态类型生成的场合;类似intern字符串缓存占用太多空间，也会导致ooM问题。对应的异常信息，会标记出来和永久代相关:“java.lang.outOfMemoryError: PermGen space"。
随着元数据区的引入，方法区内存已经不再那么窘迫，所以相应的ooM有所改观，出现0OM，异常信息则变成了:“java.lang.outofMemoryError: Metaspace"。直接内存不足，也会导致oOM。

这里面隐含着一层意思是，在抛出outOfMemoryError之前，通常垃圾收集器会被触发，尽其所能去清理出空间。
- 例如:在引用机制分析中，涉及到JVM会去尝试回收软引用指向的对象等。
- 在java.nio.BIts.reserveMemory()方法中，我们能清楚的看到，System.gc()会被调用，以清理空间。
当然，也不是在任何情况下垃圾收集器都会被触发的
- 比如，我们去分配一个超大对象，类似一个超大数组超过堆的最大值，JVM可以判断出垃圾收集并不能解决这个问题，所以直接抛出outOfMemoryError。

内存泄漏：

也称作“存储渗漏”。严格来说，只有对象不会再被程序用到了，但是cc又不能回收他们的情况，才叫内存泄漏。
但实际情况很多时候一些不太好的实践（或疏忽）会导致对象的生命周期变得很长甚至导致OOMm，也可以叫做宽泛意义上的“内存泄漏”。
尽管内存泄漏并不会立刻引起程序崩溃，但是一旦发生内存泄漏，程序中的可用内存就会被逐步蚕食，直至耗尽所有内存，最终出现outOfMemory异常，导致程序崩溃。
注意，这里的存储空间并不是指物理内存，而是指虚拟内存大小，这个虚拟内存大小取决于磁盘交换区设定的大小。

举例：

1、单例模式
单例的生命周期和应用程序是一样长的，所以单例程序中，如果持有对外部对象的引用的话，那么这个外部对象是不能被回收的，则会导致内存泄漏的产生。
2、一些提供close的资源未关闭导致内存泄漏
数据库连接(dataSourse.getconnection( ))，网络连接(socket)和io连接必须手动close，否则是不能被回收的。

12.3 Stop the World

stop-the-world ，简称sTw，指的是cc事件发生过程中，会产生应用程序的停顿。停顿产生时整个应用程序线程都会被暂停，没有任何响应，有点像卡死的感觉，这个停顿称为STw。
- 可达性分析算法中枚举根节点(GC Roots）会导致所有Java执行线程停顿。
  - 分析工作必须在一个能确保一致性的快照中进行
  - 一致性指整个分析期间整个执行系统看起来像被冻结在某个时间点上
  - 如果出现分析过程中对象引用关系还在不断变化，则分析结果的准确性无法保证
被sTw中断的应用程序线程会在完成GC之后恢复，频繁中断会让用户感觉像是网速不快造成电影卡带一样，所以我们需要减少STw的发生。

STw事件和采用哪款GC无关I所有的cC都有这个事件。

哪怕是G1也不能完全避免stop-the-world 情况发生，只能说垃圾回收器越来越优秀，回收效率越来越高，尽可能地缩短了暂停时间。
STw是JVM在后台自动发起和自动完成的。在用户不可见的情况下，把用户正常的工作线程全部停掉。
开发中不要用system.gc();会导致stop-the-world的发生。

12.4 垃圾回收的并行与并发

并发：

在操作系统中，是指一个时间段中有几个程序都处于已启动运行到运行完毕之间，且这几个程序都是在同一个处理器上运行。
并发不是真正意义上的“同时进行”，只是cPU把一个时间段划分成几个时间片段(时间区间)，然后在这几个时间区间之间来回切换，由于CPu处理的速度非常快，只要时间间隔处理得当，即可让用户感觉是多个应用程序同时在进行。

并行：

当系统有一个以上cPU时，当一个CPU执行一个进程时，另一个CPU可以执行另一个进程,两个进程互不抢占CPU资源，可以同时进行，我们称之为并行(Parallel)。
其实决定并行的因素不是CPU的数量，而是cPU的核心数量，比如一个CPU多个核也可以并行。
适合科学计算，后台处理等弱交互场景

二者对比：

并发，指的是多个事情,在同一时间段内同时发生了。
并行，指的是多个事情,在同一时间点上同时发生了。
并发的多个任务之间是互相抢占资源的。并行的多个任务之间是不互相抢占资源的。
只有在多CPU或者一个CPU多核的情况中，才会发生并行。否则，看似同时发生的事情，其实都是并发执行的。

并发和并行，在谈论垃圾收集器的上下文语境中，它们可以解释如下:

并行(Parallel):指多条垃圾收集线程并行工作，但此时用户线程仍处于等待状态。
- 如ParNew、Parallel Scavenge、Parallel old;
串行(serial)
- 相较于并行的概念，单线程执行。
- 如果内存不够，则程序暂停，启动JVM垃圾回收器进行垃圾回收。回收完，再启动
  程序的线程。
并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的，可能会交替执行)，垃圾回收线程在执行时不会停顿用户程序的运行。
- 用户程序在继续运行，而垃圾收集程序线程运行于另一个cU上;
- 如:CMs、G1

12.5 安全点与安全区域

程序执行时并非在所有地方都能停顿下来开始Gc，只有在特定的位置才能停顿下来开始Gc，这些位置称为“安全点（Safepoint) ”。
Safe Point的选择很重要，如果太少可能导致Gc等待的时间太长，如果太频繁可能导致运行时的性能问题。大部分指令的执行时间都非常短暂，通常会根据“是否具有让程序长时间执行的特征”为标准。比如:选择一些执行时间较长的指令作为Safe Point，如方法调用、循环跳转和异常跳转等。

如何在cc发生时，检查所有线程都跑到最近的安全点停顿下来呢?

抢先式中断:（目前没有虚拟机采用了)
首先中断所有线程。如果还有线程不在安全点，就恢复线程，让线程跑到安全点。
主动式中断:
设置一个中断标志，各个线程运行到safe Point的时候主动轮询这个标志，如果中断标志为真，则将自己进行中断挂起。

安全区域：

safepoint机制保证了程序执行时，在不太长的时间内就会遇到可进入 GC的 Safepoint 。但是，程序“不执行”的时候呢?例如线程处于sleep状态或Blocked状态，这时候线程无法响应VM的中断请求，“走”到安全点去中断挂起，JVM也不太可能等待线程被唤醒。对于这种情况，就需要安全区域(Safe Region）来解决。
安全区域是指在一段代码片段中，对象的引用关系不会发生变化，在这个区域中的任何位置开始cc都是安全的。我们也可以把 safe Region看做是被扩展了的safepoint。

实际执行：

1、当线程运行到safe Region的代码时，首先标识已经进入了Safe Region,如果这段时间内发生Gc，JVM会忽略标识为Safe Region状态的线程;
2、当线程即将离开safe Region时，会检查VM是否已经完成Gc，如果完成了，则继续运行，否则线程必须等待直到收到可以安全离开Safe Region的信号为止;

12.6 再谈引用

Reference子类中只有终结器引用是包内可见的，其他3种引用类型均为public，可以在应用程序中直接使用

强引用(StrongReference):最传统的“引用”的定义，是指在程序代码之中普遍
存在的引用赋值，即类似“object obj=new object()”这种引用关系。无论任何情况下，只要强引用关系还存在，垃圾收集器就永远不会回收掉被引用的对象。
软引用(SoftReference):在系统将要发生内存溢出之前，将会把这些对象列入回收
范围之中进行第二次回收。如果这次回收后还没有足够的内存，才会抛出内存溢出异常。
弱引用(weakReference):被弱引用关联的对象只能生存到下一次垃圾收集之前。当
垃圾收集器工作时，无论内存空间是否足够，都会回收掉被弱引用关联的对象。
虚引用(PhantomReference):一个对象是否有虚引用的存在，完全不会对其生存时
间构成影响，也无法通过虚引用来获得一个对象的实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。

12.6.1 强引用 - 不回收

在 Java 程序中，最常见的引用类型是强引用（普通系统99%以上都是强引用），也就是我们最常见的普通对象引用，也是默认的引用类型。
当在Java语言中使用new操作符创建一个新的对象，并将其赋值给一个变量的时候，这个变量就成为指向该对象的一个强引用。
强引用的对象是可触及的，垃圾收集器就永远不会回收掉被引用的对象。
对于一个普通的对象，如果没有其他的引用关系，只要超过了引用的作用域或者显式地将相应（强)引用赋值为null，就是可以当做垃圾被收集了，当然具体回收时机还是要看垃圾收集策略。
相对的，软引用、弱引用和虚引用的对象是软可触及、弱可触及和虚可触及的，在一定条件下，都是可以被回收的。所以，强引用是造成Java内存泄漏的主要原因之一。

12.6.2 软引用 - 内存不足即回收

软引用是用来描述一些还有用，但非必需的对象。只被软引用关联着的对象，在系统将要发生内存溢出异常前，会把这些对象列进回收范围之中进行第二次回收，如果这次回收还没有足够的内存，才会抛出内存溢出异常。
软引用通常用来实现内存敏感的缓存。比如:高速缓存就有用到软引用。如果还有空闲内存，就可以暂时保留缓存，当内存不足时清理掉，这样就保证了使用缓存的同时，不会耗尽内存。
垃圾回收器在某个时刻决定回收软可达的对象的时候，会清理软引用，并可选地把引用存放到一个引用队列(Reference Queue）。
类似弱引用，只不过Java虚拟机会尽量让软引用的存活时间长一些，迫不得已才清理。

12.6.3 弱引用 - 发现即回收

弱引用也是用来描述那些非必需对象，只被弱引用关联的对象只能生存到下一次垃圾收集发生为止。在系统GC时，只要发现弱引用，不管系统堆空间使用是否充足，都会回收掉只被弱引用关联的对象。
但是，由于垃圾回收器的线程通常优先级很低，因此，并不一定能很快地发现持有弱引用的对象。在这种情况下，弱引用对象可以存在较长的时间。
弱引用和软引用一样，在构造弱引用时，也可以指定一个引用队列，当弱引用对象被回收时，就会加入指定的引用队列，通过这个队列可以跟踪对象的回收情况。
软引用、弱引用都非常适合来保存那些可有可无的缓存数据。如果这么做，当系统内存不足时，这些缓存数据会被回收，不会导致内存溢出。而当内存资源充足时，这些缓存数据又可以存在相当长的时间，从而起到加速系统的作用。

Object obj = new Object();  //声明强引用
WeakReference<Object> wr = new WeakReference<Object>(obj);
obj = null; //销毁强引用

弱引用对象与软引用对象的最大不同就在于，当GC在进行回收时，需要通过算法检查是否回收软引用对象，而对于弱引用对象，GC总是进行回收。弱引用对象更容易、更快被Gc回收。

12.6.4 虚引用 - 对象回收跟踪

也称为“幽灵引用”或者“幻影引用”，是所有引用类型中最弱的一个。
一个对象是否有虚引用的存在，完全不会决定对象的生命周期。如果一个对象仅持有虚引用，那么它和没有引用几乎是一样的，随时都可能被垃圾回收器回收。
它不能单独使用，也无法通过虚引用来获取被引用的对象。当试图通过虚引用的get()方法取得对象时，总是null。
为一个对象设置虚引用关联的唯一目的在于跟踪垃圾回收过程。比如:能在这个对象被收集器回收时收到一个系统通知。

虚引用必须和引用队列一起使用。虚引用在创建时必须提供一个引用队列作为参数。当垃圾回收器准备回收一个对象时，如果发现它还有虚引用，就会在回收对象后，将这个虚引用加入引用队列，以通知应用程序对象的回收情况。
由于虚引用可以跟踪对象的回收时间，因此，也可以将一些资源释放操作放置在虚引用中执行和记录。
在JDK 1.2版之后提供了PhantomReference类来实现虚引用。

Object obj = new Object();
ReferenceQueue phantomQueue = new ReferenceQueue<>();
PhantomReference<Object> pf = new PhantomReference<>(obj,phantomQueue);
obj = null;

12.7 终结器引用

它用以实现对象的finalize ()方法，也可以称为终结器引用。
无需手动编码，其内部配合引用队列使用。
在Gc时，终结器引用入队。由Finalizer线程通过终结器引用找到被引用对象并调用它的finalize ()方法，第二次Gc时才能回收被引用对象。

13、垃圾回收器

13.1 GC 分类与性能指标

GC分类：

按线程数分：可以分为串行回收器和并行回收器

串行回收指的是在同一时间段内只允许有一个CPU用于执行垃圾回收操作，此时工作线程被暂停，直至垃圾收集工作结束。
- 在诸如单cPU处理器或者较小的应用内存等硬件平台不是特别优越的场合，串行回收器的性能表现可以超过并行回收器和并发回收器。所以，串行回收默认被应用在客户端的client模式下的JVM中
- 在并发能力比较强的cPU上，并行回收器产生的停顿时间要短于串行回收器。
和串行回收相反，并行收集可以运用多个CPu同时执行垃圾回收，因此提升了应用的吞吐量，不过并行回收仍然与串行回收一样，采用独占式，使用了“stop-the-world”机制。

按照工作模式分，可以分为并发式垃圾回收器和独占式垃圾回收器。

并发式垃圾回收器与应用程序线程交替工作，以尽可能减少应用程序的停顿时间.
独占式垃圾回收器(stop the world)一旦运行，就停止应用程序中的所有用户线程，直到垃圾回收过程完全结束。

按碎片处理方式分，可分为压缩式垃圾回收器和非压缩式垃圾回收器。

压缩式垃圾回收器会在回收完成后，对存活对象进行压缩整理，消除回收后的碎片。
- 再分配对象空间使用：指针碰撞
非压缩式的垃圾回收器不进行这步操作。
- 再分配对象空间使用：空闲列表

按工作的内存区间分，又可分为年轻代垃圾回收器和老年代垃圾回收器。

评估GC的性能指标：

吞吐量:运行用户代码的时间占总运行时间的比例
- (总运行时间:程序的运行时间＋内存回收的时间)
垃圾收集开销:吞吐量的补数，垃圾收集所用时间与总运行时间的比例。
暂停时间:执行垃圾收集时，程序的工作线程被暂停的时间。
收集频率:相对于应用程序的执行，收集操作发生的频率。
内存占用: Java堆区所占的内存大小。
快速:一个对象从诞生到被回收所经历的时间。

这三者共同构成一个“不可能三角I”。三者总体的表现会随着技术进步而越来越好。一款优秀的收集器通常最多同时满足其中的两项。
这三项里，暂停时间的重要性日益凸显。因为随着硬件发展，内存占用多些越来越能容忍，硬件性能的提升也有助于降低收集器运行时对应用程序的影响，即提高了吞吐量。而内存的扩大，对延迟反而带来负面效果。
简单来说，主要抓住两点:
```
  吞吐量
  暂停时间
```

评估GC的性能指标：吞吐量(throughput)

吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值，即吞吐量=运行用户代码时间/(运行用户代码时间＋垃圾收集时间）。
- 比如:虚拟机总共运行了100分钟，其中垃圾收集花掉1分钟，那吞吐量就是99%。
这种情况下，应用程序能容忍较高的暂停时间，因此，高吞吐量的应用程序有更长的时间基准，快速响应是不必考虑的。
吞吐量优先，意味着在单位时间内，STw的时间最短:0.2 + 0.2 = 0.4

评估GC的性能指标：暂停时间(pause time)

“暂停时间”是指一个时间段内应用程序线程暂停，让GC线程执行的状态
- 例如，GC期间100毫秒的暂停时间意味着在这100毫秒期间内没有应用程序线程是活动的。
暂停时间优先，意味着尽可能让单次STw的时间最短:0.1 + 0.1 +0.1 +. 1 + 0.1 = 0.5

总结：

高吞吐量较好因为这会让应用程序的最终用户感觉只有应用程序线程在做“生产性”工作。直觉上，吞吐量越高程序运行越快。
低暂停时间（低延迟）较好因为从最终用户的角度来看不管是Gc还是其他原因导致一个应用被挂起始终是不好的。这取决于应用程序的类型，有时候甚至短暂的20o毫秒暂停都可能打断终端用户体验。因此，具有低的较大暂停时间是非常重要的，特别是对于一个交互式应用程序。
不幸的是”高吞吐量”和”低暂停时间”是一对相互竞争的目标（矛盾）。
- 因为如果选择以吞吐量优先，那么必然需要降低内存回收的执行频率，但是这样会导致GC需要更长的暂停时间来执行内存回收。
- 相反的，如果选择以低延迟优先为原则，那么为了降低每次执行内存回收时的暂
  停时间，也只能频繁地执行内存回收，但这又引起了年轻代内存的缩减和导致程序吞吐量的下降。

现在标准:在最大吞吐量优先的情况下，降低停顿时间。

13.2 不同的垃圾回收器概述

新生代收集器: serial、ParNew、Parallel scavenge;
老年代收集器:Serial old、Parallel old、CMS;
整堆收集器:G1;

13.3 Serial 回收器：串行回收

serial收集器是最基本、历史最悠久的垃圾收集器了。JDK1.3之前回收新生代唯一的选择。
serial收集器作为HotSpot中client模式下的默认新生代垃圾收集器。
serial收集器采用复制算法、串行回收和”stop-the-world”机制的方式执行内存回收。
除了年轻代之外，Serial收集器还提供用于执行老年代垃圾收集的serial old收集器。serial old收集器同样也采用了串行回收和"stop the world"机制，只不过内存回收算法使用的是标记-压缩算法。
- serial old是运行在client模式下默认的老年代的垃圾回收器
- Serial old在server模式下主要有两个用途:
  - 与新生代的Parallel Scavenge配合使用
  - 作为老年代CMS收集器的后备垃圾收集方案
  这个收集器是一个单线程的收集器，但它的“单线程”的意义并不仅仅说明它只会使用一个CPu或一条收集线程去完成垃圾收集工作，更重要的是在它进行垃圾收集时，必须暂停其他所有的工作线程，直到它收集结束(stop The world)。
优势:简单而高效（与其他收集器的单线程比），对于限定单个CPU的环境来说，Serial收集器由于没有线程交互的开销，专心做垃圾收集自然可以获得最高的单线程收集效率。
- 运行在client模式下的虚拟机是个不错的选择。
在用户的桌面应用场景中，可用内存一般不大（几十MB至一两百MB），可以在较短时间内完成垃圾收集（几十ms至一百多ms),只要不频繁发生，使用串行回收器是可以接受的。
在HotSpot虚拟机中，使用-XX:+UseSerialGc参数可以指定年轻代和老年代都使用串行收集器。
- 等价于新生代用serial GC，且老年代用serial old Gc

总结：

这种垃圾收集器大家了解，现在已经不用串行的了。而且在限定单核cpu才可以用。现在都不是单核的了。
对于交互较强的应用而言，这种垃圾收集器是不能接受的。般在Javaweb应用程序中是不会采用串行垃圾收集器的。

13.4 ParNew 回收器：并行回收

如果说serial cC是年轻代中的单线程垃圾收集器，那么ParNew收集器则是serial收集器的多线程版本。
- Par是Parallel的缩写，New:只能处理的是新生代
ParNew收集器除了采用并行回收的方式执行内存回收外，两款垃圾收集器之间几乎没有任何区别。ParNew收集器在年轻代中同样也是采用复制算法、"Stop-the-world"机制。
ParNew是很多JVM运行在server模式下新生代的默认垃圾收集器。
对于新生代，回收次数频繁，使用并行方式高效。
对于老年代，回收次数少，使用串行方式节省资源。(CPu并行需要切换线程，串行可以省去切换线程的资源)
由于ParNew收集器是基于并行回收,，那么是否可以断定ParNew收集器的回收效率在任何场景下都会比seria1收集器更高效?
- ParNew收集器运行在多CPU的环境下，由于可以充分利用多CPU、
  多核心等物理硬件资源优势，可以更快速地完成垃圾收集，提升程序的吞吐量。
- 但是在单个cPU的环境下，ParNew收集器不比serial收集器更高
  效。虽然serial收集器是基于串行回收，但是由于CPU不需要频繁地做任务切换，因此可以有效避免多线程交互过程中产生的一些额外开销。
因为除serial外，目前只有ParNew Gc能与cMs收集器配合工作

13.5 Parallel 回收器：吞吐量优先

HotSpot的年轻代中除了拥有ParNew收集器是基于并行回收的以外，Parallel Scavenge收集器同样也采用了复制算法、开行回收和"Stopthe world"机制。
那么Parallel收集器的出现是否多此一举?
- 和ParNew收集器不同，Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量( Throughput)，它也被称为吞吐量优先的垃圾收集器。
- 自适应调节策略也是Parallel scavenge与ParNew一个重要区别。
高吞吐量则可以高效率地利用CPU 时间，尽快完成程序的运算任务，主要适合在后台运算而不需要太多交互的任务。因此，常见在服务器环境中使用。例如，那些执行批量处理、订单处理、工资支付、科学计算的应用程序。
Parallel收集器在JDK1.6时提供了用于执行老年代垃圾收集的Parallel old收集器，用来代替老年代的serial old收集器。
Parallel old收集器采用了标记-压缩算法，但同样也是基于并行回收和"stop-the-world"机制。

在程序吞吐量优先的应用场景中，Parallel收集器和Parallel old收集器的组合，在server模式下的内存回收性能很不错。
在Java8中，默认是此垃圾收集器。

参数配置：

-x :+UseParalle1cc手动指定年轻代使用Parallel并行收集器执行内存回收任务。
-X:+UseParallel01dGc手动指定老年代都是使用并行回收收集器。
    >分别适用于新生代和老年代。默认jdk8是开启的。
    >上面两个参数，默认开启一个，另一个也会被开启。（互相激活)
-XX: Paralle1GCThreads设置年轻代并行收集器的线程数。一般地，最好与CPU数量相等，
    以避免过多的线程数影响垃圾收集性能。
在默认情况下，当CPU 数量小于8个，ParallelGCThreads 的值等于CPU数量。
>当cPu数量大于8个，ParallelGCThreads 的值等于3+[5*CPU_Count]/8]。

-Xx:MaxGCPauseMilis设置垃圾收集器最大停顿时间(即sTw的时间)。单位是毫秒。
    为了尽可能地把停顿时间控制在MaxGCPauseMills以内，收集器在工作时会调整Java堆大小
或者其他一些参数。
    对于用户来讲，停顿时间越短体验越好。但是在服务器端，我们注重高并发，整体的吞吐量。
所以服务器端适合Parallel，进行控制。
    >该参数使用需谨慎。
-Xxx:GCTimeRatio垃圾收集时间占总时间的比例(= 1 / (N + 1) )。用于衡量吞吐量的大小。
    >取值范围（0,100）。默认值99，也就是垃圾回收时间不超过1%
    >与前一个-XX:MaxGCPauseMillis参数有一定矛盾性。暂停时间越长，Radio参数就容易
超过设定的比例。

-XX:+UseAdaptivesizePolicy设置Parallel scavenge收集器具有自适应调节策略
    在这种模式下，年轻代的大小、Eden和survivor的比例、晋升老年代的对象年龄等参数会被
自动调整，己达到在堆大小、吞吐量和停顿时间之间的平衡点。
    在手动调优比较困难的场合，可以直接使用这种自适应的方式，仅指定虚拟机的最大堆、目标的
吞吐量(GCTimeRatio）和停顿时间(MaxGCPauseMills) ，让虚拟机自己完成调优工作。

13.6 CMS 回收器：低延迟

在JDK 1.5 时期，HotSpot推出了一款在强交互应用中几乎可认为有划时代意义的垃圾收集器:CMS (Concurrent-Mark-Sweep)收集器，这款收集器是HotSpot虚拟机中第一款真正意义上的并发收集器，它第一次实现了让垃圾收集线程与用户线程同时工作。
CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短（低延迟）就越适合与用户交互的程序，良好的响应速度能提升用户体验。
- 目前很大一部分的Java应用集中在互联网站或者B/s系统的服务端上，这类应用尤其重视服务的响应速度，希望系统停顿时间最短，以给用户带来较好的体验CMS收集器就非常符合这类应用的需求。
CMS的垃圾收集算法采用标记-清除算法，并且也会"stop-the-world"

不幸的是，CMS作为老年代的收集器，却无法与JDK 1.4.0中已经存在的新生代收集器Parallel scavenge 配合工作，所以在JDK 1.5中使用CMS来收集老年代的时候，新生代只能选择ParNew或者serial收集器中的一个。
在G1出现之前，CMS使用还是非常广泛的。一直到今天，仍然有很多系统使用CMS GC。

CMS整个过程比之前的收集器要复杂,整个过程分为4个主要阶段，即初始标记阶段、并发标记阶段、重新标记阶段和并发清除阶段。

初始标记(Initial-Mark)阶段:在这个阶段中，程序中所有的工作线程都将会因为
“stop-the-world”机制而出现短暂的暂停，这个阶段的主要任务仅仅只是标记出
GC Roots能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用线程。由于直接关联对象比较小，所以这里的速度非常快。
并发标记（Concurrent-Mark)阶段:从GC Roots的直接关联对象开始遍历整个对
象图的过程，这个过程耗时较长但是不需要停顿用户线程，可以与垃圾收集线程一起并发运行。
重新标记（Remark)阶段:由于在并发标记阶段中，程序的工作线程会和垃圾收集
线程同时运行或者交叉运行，因此为了修正并发标记期间，因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录，这个阶段的停顿时间通常会比初始标记阶段稍长一些，但也远比并发标记阶段的时间短。
并发清除（Concurrent-Sweep）阶段:此阶段清理删除掉标记阶段判断的已经死亡的对象，释放内存空间。由于不需要移动存活对象，所以这个阶段也是可以与用户线程同时并发的

尽管CMS收集器采用的是并发回收（非独占式)，但是在其初始化标记和再次标记这两个阶段中仍然需要执行 “Stop-the-world“ 机制暂停程序中的工作线程，不过暂停时间并不会太长，因此可以说明目前所有的垃圾收集器都做不到完全不需要“stop-the-world”，只是尽可能地缩短暂停时间。
由于最耗费时间的并发标记与并发清除阶段都不需要暂停工作，所以整体的回收是低停的。
另外，由于在垃圾收集阶段用户线程没有中断，所以在CMS回收过程中，还应该确保应用程序用户线程有足够的内存可用。因此，CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集，而是当堆内存使用率达到某一阈值时，便开始进行回收，以确保应用程序在CMS工作过程中依然有足够的空间支持应用程序运行。要是CMS运行期间预留的内存无法满足程序需要，就会出现一次“Concurrent Mode Failure”失败，这时虚拟机将启动后备预案：临时启用serial old收集器来重新进行老年代的垃圾收集，这样停顿时间就很了。
CMs收集器的垃圾收集算法采用的是标记-清除算法，这意味着每次执行完内存回收后，由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块，不可避免地将会产生一些内存碎片。那么CMS在为新对象分配内存空间时，将无法使用指针碰撞（Bump the Pointer）技术，而只能够选择空闲列表（(Free List）执行内存分配。

问题：Mark Sweep 会造成内存碎片，为什么不把算法换成Mark Compact呢？

答：因为当并发清除的时候，用compact整理内存的话，原来的用户线程使用的内存还怎么用呢?要保证用户线程能继续执行，前提的它运行的资源不受影响嘛。Mark Compact更适合“Stop the world”这种场景下使用。

CMS的优点:

并发收集
低延迟

CMs的弊端:
1）会产生内存碎片，导致并发清除后，用户线程可用的空间不足。在无法分配大对象的情况下，不得不提前触发Full GC。
2)CMS收集器对CPu资源非常敏感。在并发阶段，它虽然不会导致用户停顿，但是会因为占用了一部分线程而导致应用程序变慢，总吞吐量会降低。
3)CMS收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure"失败而导致另一次 Full GC 的产生。在并发标记阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的，那么在并发标记阶段如果产生新的垃圾对象，CMS将无法对这些垃圾对象进行标记，最终会导致这些新产生的垃圾对象没有被及时回收，从而只能在下一次执行Gc时释放这些之前未被回收的内存空间。

参数设置：

-XX:+UseConcMarkSweepcc手动指定使用cMS收集器执行内存回收任务。
- 开启该参数后会自动将-XX :+UseParNewGc打开。即: ParNew ( Young区用)+CMs (old区用)+Serial old的组合。
-xx: CMS1nitiatingoccupanyFraction设置堆内存使用率的阈值，一旦达到该阈值，便开始进行回收。
- JDK5及以前版本的默认值为68,即当老年代的空间使用率达到68%时，会执行一次CMS回收。JDK6及以上版本默认值为92%
- 如果内存增长缓慢，则可以设置一个稍大的值，大的阈值可以有效降低cMs的触发率，减少老年代回收的次数可以较为明显地改善应用程序性能。反之，如果应用程序内存使用率增长很快，则应该降低这个阈值，以避免频繁触发老年代串行收集器。因此通过该选项便可以有效降低Full GC 的执行次数。
-XX :+UseCMSCompactAtFullCollection用于指定在执行完FullGC后对内存空间进行压缩整理，以此避免内存碎片的产生。不过由于内存压缩整理过程无法并发执行，所带来的问题就是停顿时间变得更长了。
-XX: CMSFullGCsBeforeCompaction设置在执行多少次Full Gc后对内存空间进行压缩整理。
-XX: ParallelCMSThreads设置CMS的线程数量。
CMS 默认启动的线程数是(ParallelGCThreads+3) /4，
ParallelGCThreads是年轻代并行收集器的线程数。当CPU资源比较紧张时，受到CMS收集器线程的影响，应用程序的性能在垃圾回收阶段可能会非常糟糕。

小结:
HotSpot有这么多的垃圾回收器，那么如果有人问，serial GC、
Parallel GC、Concurrent Mark Sweep GC这三个GC有什么不同呢?

请记住以下口令:

如果你想要最小化地使用内存和并行开销，请选serial GC;
如果你想要最大化应用程序的吞吐量，请选Parallel GC;
如果你想要最小化GC的中断或停顿时间，请选CMS GC。

13.7 G1回收器：区域化分代式

问题：既然我们已经有了前面几个强大的Gc，为什么还要发布Garbage First (G1)Gc?

原因就在于应用程序所应对的业务越来越庞大、复杂，用户越来越多，没有cc就不能保证应用程序正常进行，而经常造成STw的Gc又跟不上实际的需求，所以才会不断地尝试对Gc进行优化。G1 (Garbage-First）垃圾回收器是在Java7 update 4之后引入的一个新的垃圾回收器，是当今收集器技术发展的最前沿成果之一。

与此同时，为了适应现在不断扩大的内存和不断增加的处理器数量，进一步降低暂停时间(pause time)，同时兼顾良好的吞吐量。
官方给G1设定的目标是在延迟可控的情况下获得尽可能高的吞吐量，所以才担当起“全功能收集器”的重任与期望。

问题：为什么名字叫做 Garbage First(G1) 呢？

因为G1是一个并行回收器，它把堆内存分割为很多不相关的区域(Region)（物理上不连续的）。使用不同的Region来表示Eden、幸存者0区，幸存者1区，老年代等。
G1 GC有计划地避免在整个Java 堆中进行全区域的垃圾收集。G1 跟踪各个 Region里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值)，在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region。
由于这种方式的侧重点在于回收垃圾最大量的区间(Region)，所以我们给G1一个名字:垃圾优先(Garbage First) 。

G1 (Garbage-First)是一款面向服务端应用的垃圾收集器，主要针对配备多核cPU及大容量内存的机器，以极高概率满足cc停顿时间的同时，还兼具高吞吐量的性能特征。
在JDK1.7版本正式启用，移除了Experimental的标识，是JDK 9以后的影认垃圾回收器，取代了cMS回收器以及Parallel + Parallel old组合被oracle官方称为“全功能的垃圾收集器”。
与此同时，CMS已经在JDK9中被标记为废弃(deprecated)。在jdk8中还不是默认的垃圾回收器，需要使用-XX:+UseG1cc来启用。

G1回收器的特定（优势）

与其他 GC收集器相比，G1使用了全新的分区算法，其特点如下所示:

并行与并发
- 并行性: G1在回收期间，可以有多个cc线程同时工作，有效利用多核计算能力。此
  时用户线程STW
- 并发性: G1拥有与应用程序交替执行的能力，部分工作可以和应用程序同时执行，
  因此，一般来说，不会在整个回收阶段发生完全阻塞应用程序的情况
分代收集
- 从分代上看，G1依然属于分代型垃圾回收器，它会区分年轻代和老年代，年轻代依
  然有Eden区和survivor区。但从堆的结构上看，它不要求整个Eden区、年轻代或者老年代都是连续的，也不再坚持固定大小和固定数量。
- 将堆空间分为若干个区域(Region),这些区域中包含了逻辑上的年轻代和老年代。
- 和之前的各类回收器不同，它同时兼顾年轻代和老年代。对比其他回收器，或者工
  作在年轻代，或者工作在老年代:
空间整合
- CMS:“标记-清除”算法、内存碎片、若干次Gc后进行一次碎片整理
- G1将内存划分为一个个的region。内存的回收是以region作为基本单位的。
  Region之间是复制算法，但整体上实际可看作是标记-压缩（Mark-Compact)算法，两种算法都可以避免内存碎片。这种特性有利于程序长时间运行，分配大对象时不会因为无法找到连续内存空间而提前触发下一次Gc。尤其是当Java堆非常大的时候，G1的优势更加明显。
可预测的停顿时间模型（即:软实时soft real-time)
这是G1相对于CMs 的另一大优势，G1除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不得超过N毫秒。
- 由于分区的原因，G1可以只选取部分区域进行内存回收，这样缩小了回收的范围，因此对于全局停顿情况的发生也能得到较好的控制。
- G1 跟踪各个 Region里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region。保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。
- 相比于cMs Gc，G1未必能做到cMs在最好情况下的延时停顿，但是最差情况要好很多。

G1回收器的缺点：

相较于CMS，G1还不具备全方位、压倒性优势。比如在用户程序运行过程中，G1无论是为了垃圾收集产生的内存占用(Footprint）还是程序运行时的额外执行负载（overload）都要比CMS要高。
从经验上来说，在小内存应用上CMS的表现大概率会优于G1，而G1在大内存应用上则发挥其优势。平衡点在6-8GB之间。

参数设置：

-XX: +UseG1GC手动指定使用G1收集器执行内存回收任务。
-XX:G1HeapRegionSize设置每个Region的大小。值是2的幂，范围是1MB到32MB之间，目标是根据最小的Java堆大小划分出约2048个区域。默认是堆内存的1/2000。
-XX:MaxGCPauseMillis设置期望达到的最大GC停顿时间指标(JVM会尽力实现，但不保证达到)。默认值是200ms
-XX:Paralle1GCThread设置STW工作线程数的值。最多设置为8
-XX:ConcGCThreads设置并发标记的线程数。将n设置为并行垃圾回收线程数(ParallelGCThreads)的1/4左右。
-XX:InitiatingHeapoccupancyPercent设置触发并发GC周期的Java堆占用率阈值。超过此值，就触发Gc。默认值是45。

G1的设计原则就是简化JVM性能调优，开发人员只需要简单的三步即可完成调优:
    第一步:开启G1垃圾收集器

    第二步:设置堆的最大内存

    第三步:设置最大的停顿时间

G1中提供了三种垃圾回收模式: YoungGC、Mixed GC和Full Gc，在不同的条件下被触发。

G1回收器的适用场景：

面向服务端应用，针对具有大内存、多处理器的机器。(在普通大小的堆里表现并不惊喜)
最主要的应用是需要低cc延迟，并具有大堆的应用程序提供解决方案;
如:在堆大小约6GB或更大时，可预测的暂停时间可以低于e.5秒;(G1通过每次只清理一部分而不是全部的Region的增量式清理来保证每次Gc停顿时间不会过长）。
用来替换掉JDK1.5中的CMS收集器：
在下面的情况时，使用G1可能比CMS好:
- 超过50%的Java堆被活动数据占用;
- 对象分配频率或年代提升频率变化很大;
- Gc停顿时间过长(长于e.5至1秒)。
HotSpot垃圾收集器里，除了G1以外，其他的垃圾收集器使用内置的JVM线程执行GC的多线程操作，而G1 GC可以采用应用线程承担后台运行的Gc工作，即当JVM的GC线程处理速度慢时，系统会调用应用程序线程帮助加速垃圾回收过程。

region使用介绍

分区Region：化整为零

使用G1收集器时，它将整个Java堆划分成约2048个大小相同的独立Region块，每个Region块大小根据堆空间的实际大小而定，整体被控制在1MB到32MB之间，且为2的N次幂，即1MB，2MB，4MB，8MB,16MB,32MB。可以通过-XX:GlHeapRegionsize设定。所有的Region大小相同，且在JVM生命周期内不会被改变。
虽然还保留有新生代和老年代的概念，但新生代和老年代不再是物理隔离的了，它们都是一部分Region(不需要连续）的集合。通过Region的动态分配方式实现逻辑上的连续。
一个region有可能属于Eden，survivor 或者 old/Tenured内存区域。但是一个region只可能属于一个角色。图中的E表示该region属于Eden内存区域，s表示属于survivor内存区域，o表示属于old内存区域。图中空白的表示未使用的内存空间。
G1垃圾收集器还增加了一种新的内存区域，叫做Humongous 内存区域，如图中的 H块。主要用于存储大对象，如果超过1.5个region，就放到H。

设置H的原因：

对于堆中的大对象，默认直接会被分配到老年代，但是如果它是一个短期存在的大对象就会对垃圾收集器造成负面影响。为了解决这个问题，G1划分了一个Humongous区，它用来专门存放大对象。如果一个H区装不下一个大对象，那么G1会寻找连续的H区来存储。为了能找到连续的H区，有时候不得不启动Full Gc。G1的大多数行为都把H区作为老年代的一部分来看待。

G1回收器垃圾回收过程

G1 GC的垃圾回收过程主要包括如下三个环节:

年轻代Gc(Young GC)
老年代并发标记过程(Concurrent Marking)
混合回收(Mixed GC)
(如果需要，单线程、独占式、高强度的Full GC还是继续存在的。它针对GC的评估失败提供了一种失败保护机制，即强力回收。)

顺时针，young gc -> young gc + concurrent mark-> Mixed Gc顺序,进行垃圾回收。

应用程序分配内存，当年轻代的Eden区用尽时开始年轻代回收过程;G1的年轻代收集阶段是一个并行的独占式收集器。在年轻代回收期，G1 GC暂停所有应用程序线程，启动多线程执行年轻代回收。然后从年轻代区间移动存活对象到survivor区间或者老年间，也有可能是两个区间都会涉及。
当堆内存使用达到一定值（默认45%）时，开始老年代并发标记过程。
标记完成马上开始混合回收过程。对于一个混合回收期，G1 Gc从老年区间移动存活对象到空闲区间，这些空闲区间也就成为了老年代的一部分。和年轻代不同，老年代的G1回收器和其他Gc不同，G1的老年代回收器不需要整个老年代被回收，一次只需要扫描/回收一小部分老年代的Region就可以了。同时，这个老年代Region是和年轻代一起被回收的。
举个例子:一个web服务器，Java进程最大堆内存为4G，每分钟响应1500个请求，每45秒钟会新分配大约2G的内存。G1会每45秒钟进行一次年轻代回收，每31个小时整个堆的使用率会达到45%，会开始老年代并发标记过程，标记完成后开始四到五次的混合回收。

问题：

一个对象被不同区域引用的问题
一个Region不可能是孤立的，一个Region中的对象可能被其他任意Region中对象引用，判断对象存活时，是否需要扫描整个Java堆才能保证准确?
在其他的分代收集器，也存在这样的问题（而G1更突出)回收新生代也不得不同时扫描老年代?
这样的话会降低Minor Gc的效率;

解决办法：

无论G1还是其他分代收集器，JVM都是使用Remembered set来避免全局扫描:
每个Region都有一个对应的Remembered set;
每次Reference类型数据写操作时，都会产生一个write Barrier暂时中断操作;
然后检查将要写入的引用指向的对象是否和该Reference类型数据在不同的Region(其他收集器:检查老年代对象是否引用了新生代对象）﹔
如果不同，通过CardTable把相关引用信息记录到引用指向对象的所在Region对应的Remembered set中;
当进行垃圾收集时，在Gc根节点的枚举范围加入Remembered Set;就可以保证不进行全局扫描，也不会有遗漏。

垃圾回收过程的详细说明：

G1回收过程一：年轻代GC

JVM启动时，G1先准备好Eden区，程序在运行过程中不断创建对象到Eden区，当Eden空间耗尽时，G1会启动一次年轻代垃圾回收过程。
年轻代垃圾回收只会回收Eden区和survivor区。
YGC时，首先G1停止应用程序的执行(Stop-The-world) ,G1创建回收集（collection set)，回收集是指需要被回收的内存分段的集合，年轻代回收过程的回收集包含年轻代Eden区和Survivor区所有的内存分段。

然后开始如下回收过程：

第一阶段，扫描根。
根是指static变量指向的对象，正在执行的方法调用链条上的局部变量等。根引用连同RSet记录的外部引用作为扫描存活对象的入口。
第二阶段,更新RSet。
处理dirty card queue(见备注)中的card，更新RSet。此阶段完成后，RSet可以准确的反映老年代对所在的内存分段中对象的引用。
第三阶段，处理RSet。
识别被老年代对象指向的Eden中的对象，这些被指向的Eden中的对象被认为是存活的对象。
第四阶段，复制对象。
此阶段，对象树被遍历，Eden区内存段中存活的对象会被复制到survivor区中空的内存分段Survivor区内存段中存活的对象如果年龄未达阈值，年龄会加1，达到阀值会被会被复制到old区中空的内存分段。如果survivor空间不够，Eden空间的部分数据会直接晋升到老年代空间。
第五阶段，处理引用。
处理Soft，weak，Phantom，Final，JNI weak等引用。最终Eden空间的数据为空，Gc停止工作，而目标内存中的对象都是连续存储的，没有碎片，所以复制过程可以达到内存整理的效果，减少碎片。

G1回收过程二：并发标记过程

初始标记阶段:标记从根节点直接可达的对象。这个阶段是STw的，并且会触发一次年轻代Gc。
根区域扫描（Root Region Scanning) : 61 Gc扫描survivor区直接可达的老年代区域对象，并标记被引用的对象。这一过程必须在young Gc之前完成。
并发标记(Concurrent Marking):在整个堆中进行并发标记(和应用程序并发执行)，此过程可能被young Gc中断。在并发标记阶段，若发现区域对象中的所有对象都是垃圾，那这个区域会被立即回收。同时，并发标记过程中，会计算每个区域的对象活性(区域中存活对象的比例)。
再次标记(Remark):由于应用程序持续进行，需要修正上一次的标记结果。是STw的。G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)。
独占清理(cleanup,STw):计算各个区域的存活对象和cc回收比例，并进行排序，识别可以混合回收的区域。为下阶段做铺垫。是STw的。
这个阶段并不会实际上去做垃圾的收集
并发清理阶段:识别并清理完全空闲的区域。

G1回收过程三：混合回收

并发标记结束以后，老年代中百分百为垃圾的内存分段被回收了，部分为垃圾的内存分段被计算了出来。默认情况下，这些老年代的内存分段会分8次（可以通过-
XX:G1MixedGccountTarget设置)被回收。
混合回收的回收集（Collection Set）包括八分之一的老年代内存分段，Eden区内存分段，Survivor区内存分段。混合回收的算法和年轻代回收的算法完全一样，只是回收集多了老年代的内存分段。具体过程请参考上面的年轻代回收过程。
由于老年代中的内存分段默认分8次回收，61会优先回收垃圾多的内存分段。垃圾占内存分段比例越高的，越会被先回收。并且有一个阙值会决定内存分段是否被回收，-XX:G1MixedGCLiveThresholdPercent，默认为65%，意思是垃圾占内存分段比例要达到65%才会被回收。如果垃圾占比太低，意味着存活的对象占比高，在复制的时候会花费更多的时间。
混合回收并不一定要进行8次。有一个阙值-XX:G1HeapwastePercent，默认值为10%，意思是允许整个堆内存中有10%的空间被浪费，意味着如果发现可以回收的垃圾占堆内存的比例低于10%，则不再进行混合回收。因为Gc会花费很多的时间但是回收到的内存却很少。

G1回收可选的过程四：Full GC

G1的初衷就是要避免Full Gc的出现。但是如果上述方式不能正常工作，G1会停止应用程序的执行(Stop-The-world)，使用单线程的内存回收算法进行垃圾回收，性能会非常差，应用程序停顿时间会很长。
要避免Full Gc的发生，一旦发生需要进行调整。什么时候会发生Full Gc呢?比如堆内存太小，当G1在复制存活对象的时候没有空的内存分段可用，则会回退到full gc，这种情况可以通过增大内存解决。

导致G1Full GC的原因可能有两个:

Evacuation的时候没有足够的to-space来存放晋升的对象;
并发处理过程完成之前空间耗尽。

G1 回收器优化建议

年轻代大小
- 避免使用-xmn或-XX:NewRatio等相关选项显式设置年轻代大小
- 固定年轻代的大小会覆盖暂停时间目标
暂停时间目标不要太过严苛
- G1 GC的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间
- 评估G1 GC的吞吐量时，暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销，而这些会直接影响到吞吐量。

13.8 垃圾回收器总结

垃圾收集器	分类	作用位置	使用算法	特点	适用场景
Serial	串行运行	作用于新生代	复制算法	响应速度优先	适用于单CPU环境下的client模式
ParNew	并行运行	作用于新生代	复制算法	响应速度优先	多CPU环境Server模式下与CMS配合使用
Parallel	并行运行	作用于新生代	复制算法	吞吐量优先	适用于后台运算而不需要太多交互的场景
Serial old	串行运行	作用于老年代	标记-压缩算法	响应速度优先	适用于单CPU环境下的Client模式
Parallel old	并行运行	作用于老年代	标记-压缩算法	吞叶量优先	适用于后台运算而不需要太多交互的场景
cMs	并发运行	作用于老年代	标记-清除算法	响应速度优先	适用于互联网或B/S业务
G1	并发、并行	作用于新生代、老年代	标记-压缩算法、复制算法	响应速度优先	面向服务端应用

问题：怎么选择垃圾收集器？

优先调整堆的大小让JVM自适应完成。

如果内存小于100M，使用串行收集器
如果是单核、单机程序，并且没有停顿时间的要求，串行收集器
如果是多cPU、需要高吞吐量、允许停顿时间超过1秒，选择并行或者JVM自己选择
如果是多cPU、追求低停顿时间，需快速响应（比如延迟不能超过1秒，如互联网应用），使用并发收集器
官方推荐G1，性能高。现在互联网的项目，基本都是使用G1。

面试题：

垃圾收集的算法有哪些?

如何判断一个对象是否可以回收?垃圾收集器工作的基本流程。

13.9 GC 日志分析

内存分配与垃圾回收的参数列表
-XX:+PrintGc
输出Gc日志。类似: -verbose:gc
-XX :+PrintGCDetails
输出Gc的详细日志
-XX:+PrintGcTimestamps 输出Gc的时间戳（以基准时间的形式)
-XX:+PrintGCDatestamps 输出Gc的时间戳（以日期的形式，如2013-05-04T21:53:59.234+0800)
-XX:+PrintHeapAtGc
在进行Gc的前后打印出堆的信息
-Xloggc : . ./ 1ogs/gc.log日志文件的输出路径

日志补充说明：

“[Gc"和”[Full Gc"说明了这次垃圾收集的停顿类型，如果有"Full"则说明cc发生了"stopThe world"
使用serial收集器在新生代的名字是Default New Generation，因此显示的是"[DefNew"
使用ParNew收集器在新生代的名字会变成"[ParNew",意思是"Parallel New Generation"
使用Parallel Scavenge收集器在新生代的名字是"[PSYoungGen"
老年代的收集和新生代道理一样，名字也是收集器决定的
使用G1收集器的话，会显示为"garbage-first heap"

Heap (堆)：

PsYoungGen(Parallel scavenge收集器新生代) total 9216K,used 6234K
[0x00000000ff600000,0x0000000100000000，Ox0000000100000000)
eden space (堆中的Eden区默认占比是8)8192K,76% used
[0x00000000ff600000,0x00000000ffc16b08,0x00000000ffe00000)
from space(堆中的survivor，这里是From survivor区默认占比是1) 1024K，0% used[0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
to space (堆中的survivor，这里是to survivor区默认占比是1，需要先了解一下堆的分配策略)1024K，0% used [0x00000000ffe00000,0x00000000ffe00000,0x00000000fff00000)
Par01dGen (老年代总大小和使用大小)total 10240K，used 7001K [0x00000000fec00000,0x0000o000ff600000,ox00000000ff600000)
object space(显示个使用百分比)10240K,68% used
[0x00000000fec00000,ox00000000ff2d6630,0x00000000ff600000)
PSPermGen (永久代总大小和使用大小)total 21504K，used 4949K[0x00000000f9a00000,0xo0000000fafo0000,ox00000000feco000o)
object space (显示个使用百分比，自己能算出来)21504K，23% used[Ox00000000f9a00000,0x00000000f9ed55e0,0x00000000faf00000)

这里说错了！其实新生代发生了 YGC，将两个 2mb 的对象移动到了老年代

自己增大最后一个数组看下，最终是 eden 的使用率变高了，而不是老年代的使用率变高了！！！

GC日志分析工具

常用的日志分析工具有：GCViewer、GCEasy、GCHisto、GCLogViewer、Hpjmeter、garbagecat

13.10 垃圾回收器的新发展

GC仍然处于飞速发展之中，目前的默认选项61 Gc在不断的进行改进，很多我们原来认为的缺点，例如串行的Full Gc、card Table扫描的低效等，都已经被大幅改进，例如，JDK 10以后，Full GC已经是并行运行，在很多场景下，其表现还略优于Parallel Gc的并行Full GC实现。
即使是serial Gc，虽然比较古老，但是简单的设计和实现未必就是过时的，它本身的开销，不管是GC相关数据结构的开销，还是线程的开销，都是非常小的，所以随着云计算的兴起，在Serverless等新的应用场景下，serial Gc找到了新的舞台。
比较不幸的是cMS Gc，因为其算法的理论缺陷等原因，虽然现在还有非常大的用户群体，但在JDK9中已经被标记为废弃，并在3DK14版本中移除。

现在G1回收器已成为默认回收器好几年了。
我们还看到了引入了两个新的收集器:zGC(JDK11出现）和shenandoah(open JDK12）。
- 主打特点:低停顿时间

ZGC与shenandoah目标高度相似，在尽可能对吞吐量影响不大的前提下,实现在任意堆内存大小下都可以把垃圾收集的停顿时间限制在十毫秒以内的低延迟。
《深入理解Java虚拟机》一书中这样定义ZGC: zGc收集器是一款基于Region内存布局的，（暂时）不设分代的，使用了读屏障、染色指针和内存多重映射等技术来实现可并发的标记-压缩算法的，以低延迟为首要目标的一款垃圾收集器。
zGC的工作过程可以分为4个阶段:并发标记-并发预备重分配-并发重分配-并发重映射等。
ZGC几乎在所有地方并发执行的，除了初始标记的是sTw的。所以停顿时间几乎就耗费在初始标记上，这部分的实际时间是非常少的。