【高频java面试题】JVM的底层结构_java面试题 jvm结构-CSDN博客

本文链接：https://blog.csdn.net/wlg9527/article/details/105226481

1）问？说说JVM的底层结构

从左图可知，JVM主要包括四个部分：

1.类加载器（ClassLoader）:在JVM启动时或者在类运行时将需要的class加载到JVM中。（右图表示了从java源文件到JVM的整个过程，可配合理解。关于类的加载机制，可以参考http://blog.csdn.net/tonytfjing/article/details/47212291）

2.执行引擎：负责执行class文件中包含的字节码指令（执行引擎的工作机制，这里也不细说了，这里主要介绍JVM结构）；

3.内存区（也叫运行时数据区）：是在JVM运行的时候操作所分配的内存区。运行时内存区主要可以划分为5个区域，如图：

方法区(Method Area)：用于存储类结构信息的地方，包括常量池、静态变量、构造函数等。虽然JVM规范把方法区描述为堆的一个逻辑部分，但它却有个别名non-heap（非堆），所以大家不要搞混淆了。方法区还包含一个运行时常量池。
java堆(Heap)：存储java实例或者对象的地方。这块是GC的主要区域（后面解释）。从存储的内容我们可以很容易知道，方法区和堆是被所有java线程共享的。
java栈(Stack)：java栈总是和线程关联在一起，每当创建一个线程时，JVM就会为这个线程创建一个对应的java栈。在这个java栈中又会包含多个栈帧，每运行一个方法就创建一个栈帧，用于存储局部变量表、操作栈、方法返回值等。每一个方法从调用直至执行完成的过程，就对应一个栈帧在java栈中入栈到出栈的过程。所以java栈是现成私有的。
程序计数器(PC Register)：用于保存当前线程执行的内存地址。由于JVM程序是多线程执行的（线程轮流切换），所以为了保证线程切换回来后，还能恢复到原先状态，就需要一个独立的计数器，记录之前中断的地方，可见程序计数器也是线程私有的。
本地方法栈(Native Method Stack)：和java栈的作用差不多，只不过是为JVM使用到的native方法服务的。

4.本地方法接口：主要是调用C或C++实现的本地方法及返回结果。

2）问？一个.class文件怎么进入内存的？（转载---https://www.itzhai.com/jvm/how-class-file-load-into-jvm.html）

一、加载一个Class文件

类的生命周期

1.1、加载阶段

如上图，加载阶段主要做以下事情：

通过类全限定名获取定义此类的二进制字节流；
将字节流代表的静态存储结构转换为方法区的运行时数据结构；
在内存中生成此类的java.lang.Class对象，作为方法区这个类的各种数据的访问入口

1.1.1、如何触发加载class文件

1、遇到new、getstatic、putstatic或者invokestatic字节码指令的时候，如果类还没有初始化。对应场景为：

new一个对象；
读取或者设置一个类的静态字段；
调用类的静态方法的时候；

2、使用java.lang.reflect包的方法对类进行反射的时候，如果类还没有初始化；
3、初始化类的时候，如果父类还没有初始化，则触发父类初始化；
4、虚拟机器启动时，main方法所在的类会首先进行初始化；
5、JDK1.7中使用动态语言支持的时候，如果一个java.lang.invoke.MethodHandler实例最后解析为：REF_getStatic，REF_putStatic，REF_invokeStatic方法句柄的时候，并且句柄所对应的类没有进行过初始化。

这个时候通过类的全限定名称获取类的二进制字节流。

此时这个字节流为静态存储结构，需要转换为方法区的运行时数据结构。结构如上图方法区中所示。每个类生成一个对应的结构，结构里面的信息详细介绍参考此文：The Java Virtual Machine

其中：

ClassLoader的引用指的是加载这个Class文件的ClassLoader实例的引用；

Class实例引用指的是类加载器在加载类信息并放到方法区之后，然后创建对应的Class类型的实例，并把该实例的引用保存到Class实例引用中。

1.1.2、获取二进制流的方式

zip包，延伸为JAR、EAR、WAR包；
网络，如Applet；
动态代理；
JSP生成；
数据库获取；

1.1.3、验证二进制字节流

如上图所示，在加载阶段就已经开始做部分验证工作了，但是验证还是属于连接阶段的动作，下面介绍验证阶段。

1.2、连接阶段

连接阶段包括：验证，准备，解析

验证阶段

文件格式验证
元数据验证

字节码验证
符号引用验证

准备阶段

该阶段还并没有开始执行类的构造方法，而只是为类变量分配内存并设置类变量初始值（零值）。这些变量所使用的内存都将在方法区中分配。

基本数据类型的零值：2.3. Primitive Types and Values

这里只分配static变量，不包括实例变量。

解析阶段

解析阶段主要将常量池内的符号引用替换为直接引用。

1.3、初始化阶段

开始执行Java程序代码，这一步主要是执行类构造器<clinit>方法对类变量进行初始化的过程

3）问？了解双亲委派机制吗？

类加载器的种类：

1-启动类加载器，负责加载%JAVA_HOME%\bin目录下的所有jar包，或者是-Xbootclasspath参数指定的路径；

2-扩展类加载器：负责加载%JAVA_HOME%\bin\ext目录下的所有jar包，或者是java.ext.dirs参数指定的路径；

3-应用程序类加载器：负责加载用户类路径上所指定的类库，如果应用程序中没有自定义加载器，那么次加载器就为默认加载器。

双亲委派机制得工作过程：

1-类加载器收到类加载的请求；

2-把这个请求委托给父加载器去完成，一直向上委托，直到启动类加载器；

3-启动器加载器检查能不能加载（使用findClass()方法），能就加载（结束）；否则，抛出异常，通知子加载器进行加载。

4-重复步骤三；

以上就是双亲委派机制的原理。

4）问？什么时候会发生OOM？怎么解决？

概念

OOM，全称“Out Of Memory”，就是“内存用光了”

出现OOM的原因

1）分配的少了：比如虚拟机本身可使用的内存（一般通过启动时的VM参数指定）太少。

2）应用用的太多，并且用完没释放，浪费了。此时就会造成内存泄露或者内存溢出。

解决办法

最常见的OOM情况有以下三种：

1、java.lang.OutOfMemoryError: Java heap space ------>java堆内存溢出，此种情况最常见，一般由于内存泄露或者堆的大小设置不当引起。对于内存泄露，需要通过内存监控软件查找程序中的泄露代码，而堆大小可以通过虚拟机参数-Xms,-Xmx等修改。
2、java.lang.OutOfMemoryError: PermGen space ------>java永久代溢出，即方法区溢出了，一般出现于大量Class或者jsp页面，或者采用cglib等反射机制的情况，因为上述情况会产生大量的Class信息存储于方法区。此种情况可以通过更改方法区的大小来解决，使用类似-XX:PermSize=64m -XX:MaxPermSize=256m的形式修改。另外，过多的常量尤其是字符串也会导致方法区溢出。
3、java.lang.StackOverflowError ------> 不会抛OOM error，但也是比较常见的Java内存溢出。JAVA虚拟机栈溢出，一般是由于程序中存在死循环或者深度递归调用造成的，栈大小设置太小也会出现此种溢出。可以通过虚拟机参数-Xss来设置栈的大小。

5）问？JVM调优参数都有哪些？

JVM调优参数总结

Xmn、Xms、Xmx、Xss都是JVM对内存的配置参数。

堆内存分配

JVM初始分配的内存由-Xms指定，默认是物理内存的1/64

JVM最大分配的内存由-Xmx指定，默认是物理内存的1/4

默认空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制。

因此服务器一般设置-Xms、-Xmx相等以避免在每次GC 后调整堆的大小。对象的堆内存由称为垃圾回收器的自动内存管理系统回收。

堆设置

-Xms:初始堆大小

-Xmx:最大堆大小

-Xmn:新生代大小

-XX:NewRatio:设置新生代和老年代的比值。如：为3，表示年轻代与老年代比值为1：3

-XX:SurvivorRatio:新生代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如：为3，表示Eden：Survivor=3：2，一个Survivor区占整个新生代的1/5

-XX:MaxTenuringThreshold:设置转入老年代的存活次数。如果是0，则直接跳过新生代进入老年代

-XX:PermSize、-XX:MaxPermSize:分别设置永久代最小大小与最大大小（Java8以前）

-XX:MetaspaceSize、-XX:MaxMetaspaceSize:分别设置元空间最小大小与最大大小（Java8以后）

收集器设置

-XX:+UseSerialGC:设置串行收集器

-XX:+UseParallelGC:设置并行收集器

-XX:+UseParalledlOldGC:设置并行老年代收集器

-XX:+UseConcMarkSweepGC:设置并发收集器

垃圾回收统计信息

-XX:+PrintGC

-XX:+PrintGCDetails

-XX:+PrintGCTimeStamps

-Xloggc:filename

并行收集器设置

-XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数。

-XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间

-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)

并发收集器设置

-XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况。

-XX:ParallelGCThreads=n:设置并发收集器新生代收集方式为并行收集时，使用的CPU数。并行收集线程数。

非堆内存分配：

JVM使用-XX:PermSize设置非堆内存初始值，默认是物理内存的1/64；

由XX:MaxPermSize设置最大非堆内存的大小，默认是物理内存的1/4。

-Xss 设置每个线程可使用的内存大小，即栈的大小。在相同物理内存下，减小这个值能生成更多的线程，当然操作系统对一个进程内的线程数还是有限制的，不能无限生成。线程栈的大小是个双刃剑，如果设置过小，可能会出现栈溢出，特别是在该线程内有递归、大的循环时出现溢出的可能性更大，如果该值设置过大，就有影响到创建栈的数量，如果是多线程的应用，就会出现内存溢出的错误。

6）问？GC什么时候作用？采用什么算法？

GC分为两类：

MGC/YGC 和FGC

新生代内存不够用时候发生MGC也叫YGC，JVM内存不够的时候发生FGC

注意！！！JVM在进行GC时，大部分时候回收的都是指新生代。因此GC按照回收的区域又分了两种类型，一种是普通GC（minor GC），一种是全局GC（major GC or Full GC），它们所针对的区域如下。普通GC（minor GC）：只针对新生代区域的GC。全局GC（major GC or Full GC）：针对年老代的GC，偶尔伴随对新生代的GC以及对永久代的GC。由于年老代与永久代相对来说GC效果不好，而且二者的内存使用增长速度也慢，因此一般情况下，需要经过好几次普通GC，才会触发一次全局GC。

采用算法

1.标记-清除: 这是垃圾收集算法中最基础的，根据名字就可以知道，它的思想就是标记哪些要被回收的对象，然后统一回收。这种方法很简单，但是会有两个主要问题：1.效率不高，标记和清除的效率都很低；2.会产生大量不连续的内存碎片，导致以后程序在分配较大的对象时，由于没有充足的连续内存而提前触发一次GC动作。

2.复制算法: 为了解决效率问题，复制算法将可用内存按容量划分为相等的两部分，然后每次只使用其中的一块，当一块内存用完时，就将还存活的对象复制到第二块内存上，然后一次性清楚完第一块内存，再将第二块上的对象复制到第一块。但是这种方式，内存的代价太高，每次基本上都要浪费一般的内存。于是将该算法进行了改进，内存区域不再是按照1：1去划分，而是将内存划分为8:1:1三部分，较大那份内存交Eden区，其余是两块较小的内存区叫Survior区。每次都会优先使用Eden区，若Eden区满，就将对象复制到第二块内存区上，然后清除Eden区，如果此时存活的对象太多，以至于Survivor不够时，会将这些对象通过分配担保机制复制到老年代中。(java堆又分为新生代和老年代)