【知识点】JVM

最新推荐文章于 2022-08-26 19:14:17 发布

zz308

最新推荐文章于 2022-08-26 19:14:17 发布

阅读量133

点赞数

分类专栏： Java 技术思考 JVM 文章标签： java

本文链接：https://blog.csdn.net/weixin_41241676/article/details/113974371

版权

Java 同时被 3 个专栏收录

22 篇文章 0 订阅

订阅专栏

JVM

5 篇文章 0 订阅

订阅专栏

技术思考

3 篇文章 0 订阅

订阅专栏

知识点总结，直接上干货

JVM基本结构
JVM类加载机制
JVM运行时内存区域
JVM堆内存区域
JVM虚拟机栈
JVM垃圾回收机制
JVM垃圾回收算法
JVM常见垃圾收集器
JVM性能调优

JVM基本机构

如图所示，JVM主要包括类加载子系统、运行时内存区域、垃圾回收、PC寄存器、执行引擎、本地方法接口、本地方法库几部分。

1. 类加载器子系统

顾名思义，主要作用是用来加载.class二进制文件到JVM内存区域。

1.1 JVM类加载机制

如图所示，JVM类加载机制包括加载、连接（验证、准备、解析）、初始化三个过程。

加载：类加载中的第一个阶段，通过java类的全限定名找到.class二进制文件，加载到运行时内存区域的方法区中，并在内存中为其生成一个Clazz对象，类似指针，作为该类在方法区访问入口。
连接：连接分为三步，验证-准备-解析
     验证：验证第一步加载的.class字节码文件是否正确（JVM要加载的二进制文件，有一套约定好的定义，比如版本号、类定义、变量说明、方法说明等）
     准备：准备阶段简单来说就是为静态变量赋值0或null（对于常量而言，在准备阶段会完成赋值）
     解析：解析阶段简单来说就是将符号引用转换为直接引用的过程（所谓符号引用就是.class二进制文件中的符号定义（如CONSTANT**），JVM一次编译多次运行就体现在此，源代码被编译成二进制文件后，各种操作系统上的JVM就可以对其进行解释，翻译成操作系统可以识别的指令集）
初始化：初始化操作是类加载中的最后一个阶段，可以简单理解为为静态变量赋值，体现在二进制文件的<Clinit>方法中，若一个类没有静态变量或静态代码块，编译器可以不用生成该方法。

【思考】第一步加载过程中生成的Clazz对象保存在哪儿？

where：JDK1.7之前Clazz对象保存在方法区中，JDK1.8之后永久代取消，新增了元数据区，class二进制文件保存在元数据区（本地内存），Clazz对象保存在堆内存中。

1.2 类加载器

如图所示，JVM提供了三种类加载器：启动类加载器、扩展类加载器、应用程序类加载器、以及自定义类加载器。

启动类加载器：负责加载JAVA_HOME\lib 目录中的类文件，如rt.jar包中的启动类。
扩展类加载器：负责加载JAVA_HOME\lib\ext 目录中的扩展类，主要指的是一些功能扩展类。
应用程序类加载器：负责加载classpath类路径下的类，主要是业务类等。

1.3 双亲委派模型

所谓双亲委派，指的是一个类加载器在收到类加载的请求时，先不尝试进行加载，而是向上一级（父加载器）做出请示，让其进行加载，每级都会如此，直到启动类加载器。若上级均不能对该类进行加载时，再有该类加载器进行加载。

双亲委派的优势：
1. 保证一个系统中的一个类只能被加载一次
2. 保证加载的类都是正确的，不会对JVM造成损害（启动类只能有启动类加载器加载，启动类加载器本身对启动类最熟悉，能保证其没有被篡改）

2. 运行时内存区域

如图所示，JVM运行时内存区域包含，堆、栈（虚拟机栈）、方法区、程序计数器、本地方法栈

堆：引用对象（对象和数组）创建在此处（该区域线程共享）
方法区：.class二进制文件被加载到此处，此外还有常量池（该区域线程共享）
栈（虚拟机栈）：JVM为每一个线程分配一个栈，为每个方法分配一个栈帧，所以栈中可能包含多个栈帧。栈帧主要由：局部变量表、操作数栈、动态连接（符号引用）、方法出口（返回地址或异常出口），（该区域线程私有）
本地方法栈：同虚拟机栈，主要指的是本地方法的调用，JVM虚拟机会调用C、C++的底层接口，从而和操作系统进行交互
程序计数器：主要指的是当前程序运行到哪一行指令（对于本地方法，程序计数器没有值undefined）

3. JVM堆内存

如图所示，JVM堆内存根据对象的存活时间进行了划分，新生代（Eden、Survivor From、Survivor to），老年代。

新生代：对象存活时间短，一次GC能回收大多数的内存，一般使用复制算法
老年代：对象存活时间长，一般是大对象，一次GC回收的内存较少，一般采用标记-清除或标记-整理算法
新生代：老年代一般为1:2，JVM调优时要根据具体的业务进行调整，新生代小了，老年代大了，minor GC频率变大，一次major GC可能耗时较长；新生代大了，老年代小了，minor GC频率变小，一次major GC可能耗时变短。

4. JVM虚拟机栈

每个方法的执行会随之分配一个栈帧，栈帧里包含操作数栈，操作数栈主要保存当前变量的值，或中间临时数据，这里要重点关注一些++、--的基础运算，临时数据会被赋值给变量值，特别注意此点。

5. JVM垃圾回收机制

java语言相比C、C++语言来说，垃圾回收机制解决了程序员不少问题（如不需要手动释放内存空间），不过也可能带来内存溢出的麻烦。

对于垃圾回收，主要关注以下三点：
1. 什么是垃圾
2. 垃圾什么时候进行回收
3. 垃圾如何回收

5.1 什么是垃圾

主要两种方式来判断什么样的对象变成了垃圾：引用计数法、可达性分析。对于前者存在循环引用无法判断的缺点，对于后者要知道通常是哪些引用。

GC Roots：虚拟机栈中的引用、类中的常量引用、类中的静态变量引用、jni中的引用

5.2 垃圾什么时候进行回收

一般来说，在CPU空闲的时候，就可能会进行垃圾的回收，垃圾回收时机有JVM自己控制。调用system.gc告知JVM可以尝试回收垃圾。finallize方法中可以使当前对象重新激活。

5.3 垃圾如何回收

垃圾如何回收牵涉到垃圾回收算法以及垃圾收集器，见如下章节。

6. 垃圾回收算法

常见算法：
1. 复制算法（新生代）：简单。
2. 标记清除算法（老年代）：存在内存碎片
3. 标记整理算法（老年代）：不存在内存碎片、相对耗时。
4. 分代思想（衍生出分代算法，根据分代，分别使用不同的算法进行收集）：根据堆内存分配中不同区域的对象的存活时间特殊对待。

7. 垃圾收集器

如图所示，JDK1.7/1.8之后，Hotspot中垃圾收集器主要有7种。可根据新生代、老年代进行划分，也可以根据串行、并行进行划分。

Serial：单线程、复制、新生代垃圾收集器
ParNew：多线程、复制、新生代垃圾收集器（Serial的多线程版本）
Parallal Scavenge：多线程、复制、新生代垃圾收集器（关注系统的吞吐量）

Serial Old：单线程、标记-整理、老年代垃圾收集器（Serial的老年代版本）
ParNew Old：多线程、标记-整理、老年代垃圾收集器（ParNew的老年代版本）
CMS（Concurrent Mark Sweep）：多线程、标记-清除、老年代垃圾收集器（关注系统的吞吐量）

G1：分区收集，堆进行分区，各区又根据优先级进行排序。再最小GC停顿时间的同时，又不降低系统的吞吐量

8.JVM性能调优

一般而言，程序业务功能上的调优比JVM性能调优效果更显著，JVM性能调优是最后的一步。

8.1 GC参数

-Xmx：最大堆内存
-Xms：最小堆内存
-Xmn：
-Xss：
-XX:printGCDetails：
-XX:+UseParallelOldGC

8.2 GC日志

根据GC的日志查看新生代、老年代是否需要调优

8.3 JVM调优

粘贴复制一篇帖子一部分调优总结：
1.针对JVM堆的设置，一般可以通过-Xms -Xmx限定其最小、最大值，为了防止垃圾收集器在最小、最大之间收缩堆而产生额外的时间，通常把最大、最小设置为相同的值;
2.年轻代和年老代将根据默认的比例（1：2）分配堆内存， 可以通过调整二者之间的比率NewRadio来调整二者之间的大小，也可以针对回收代。
比如年轻代，通过 -XX:newSize -XX:MaxNewSize来设置其绝对大小。同样，为了防止年轻代的堆收缩，我们通常会把-XX:newSize -XX:MaxNewSize设置为同样大小。
3.年轻代和年老代设置多大才算合理
1）更大的年轻代必然导致更小的年老代，大的年轻代会延长普通GC的周期，但会增加每次GC的时间；小的年老代会导致更频繁的Full GC
2）更小的年轻代必然导致更大年老代，小的年轻代会导致普通GC很频繁，但每次的GC时间会更短；大的年老代会减少Full GC的频率
如何选择应该依赖应用程序对象生命周期的分布情况： 如果应用存在大量的临时对象，应该选择更大的年轻代；如果存在相对较多的持久对象，年老代应该适当增大。但很多应用都没有这样明显的特性。
在抉择时应该根 据以下两点：
（1）本着Full GC尽量少的原则，让年老代尽量缓存常用对象，JVM的默认比例1：2也是这个道理 。
（2）通过观察应用一段时间，看其他在峰值时年老代会占多少内存，在不影响Full GC的前提下，根据实际情况加大年轻代，比如可以把比例控制在1：1。但应该给年老代至少预留1/3的增长空间。
4.在配置较好的机器上（比如多核、大内存），可以为年老代选择并行收集算法： -XX:+UseParallelOldGC 。
5.线程堆栈的设置：每个线程默认会开启1M的堆栈，用于存放栈帧、调用参数、局部变量等，对大多数应用而言这个默认值太了，一般256K就足用。
理论上，在内存不变的情况下，减少每个线程的堆栈，可以产生更多的线程，但这实际上还受限于操作系统。

9.其它

9.1 进程和线程

进程和线程：个人认为，线程和进程的异同点不太好答，咋一看很简单，仔细一想无从可答，本身进程和线程是在技术发展到一定阶段的产物，可以说就没什么好比的。

进程：简单来讲，一个运行着的程序就叫做进程。进程是资源分配的最小单位，这里的资源指的寻址空间，寄存器组，堆栈空间。
线程：线程是操作系统执行的最小单位，是程序中的一串命令。

进程是资源分配的最小单位，线程是CPU调度的最小单位
相同点：均是CPU的时间片（只不过时间片大小不同）
不同点：进程是操作系统分配资源的最小单位，线程是CPU调度执行的最小单位，前者关注资源分配，后者更关注与调度执行

9.2 并发与并行

知乎上有个大神举了个例子：
你吃饭吃到一半，电话来了，你一直到吃完了以后才去接，这就说明你不支持并发也不支持并行。
你吃饭吃到一半，电话来了，你停了下来接了电话，接完后继续吃饭，这说明你支持并发。
你吃饭吃到一半，电话来了，你一边打电话一边吃饭，这说明你支持并行。
并发的关键是你有处理多个任务的能力，不一定要同时。
并行的关键是你有同时处理多个任务的能力。
所以我认为它们最关键的点就是：是否是『同时』。

【说明】有些地方未做验证，请保持怀疑态度。