快速入门JVM第一讲——JVM体系结构概述

最新推荐文章于 2024-09-17 14:28:05 发布

李阿昀

最新推荐文章于 2024-09-17 14:28:05 发布

阅读量1.6k

点赞数 5

分类专栏：快速入门JVM

本文链接：https://blog.csdn.net/yerenyuan_pku/article/details/103320757

版权

快速入门JVM 专栏收录该内容

3 篇文章 6 订阅

订阅专栏

本文是作者对JVM快速入门的学习笔记，详细介绍了JVM的体系结构，包括类加载器、执行引擎、本地接口、PC寄存器、方法区和栈。文章探讨了类加载器的双亲委派机制、执行引擎的功能、本地方法栈的作用，以及堆、栈和方法区的内存管理，特别是如何理解和解决StackOverflowError和OutOfMemoryError。通过对JVM的学习，读者可以更好地理解Java程序的运行机制和内存管理。

摘要由CSDN通过智能技术生成

相信学过Java的同学，都应该晓得JVM，它几乎是面试中必问的知识点。要想成为一名合格的Java程序员，JVM是你必须要掌握的知识点，它的重要性就不言而喻了。笔者本人也只是刚刚好入了JVM的门槛，多少对它有了一定的了解，本文详细记录了笔者本人快速入门JVM的学习过程，希望对初次学习JVM的同学有一定的借鉴之处！

JVM体系结构

在讲述JVM体系结构之前，先来看如下几道面试题，你能解决几道面试题呢？

请谈谈你对JVM的理解？Java8的虚拟机有什么更新？
什么是OOM？（随之而来的问题：它是由什么原因引起的？你是怎么去定位的？又是怎么去解决的？）什么是StackOverflowError？有哪些方法分析？
JVM的常用参数调优你知道哪些？
内存快照抓取和MAT（但凡出现了OOM，你是怎么去定位的？常用的工具就是MAT）分析DUMP文件知道吗？
谈谈JVM中，对类加载器你的认识？

初次学习JVM的同学，想必都会很懵逼，这些面试题一个也不会啊！没有关系，如果你能跟随我的脚步快速入门JVM，那么相信在你心中一定知道了以上面试题的答案。
在讲述JVM体系结构之前，你还得知道JVM所处的位置，如下图所示。
在这里插入图片描述
从上图中我们可以看出，JVM是运行在操作系统之上的，它与硬件没有直接的交互，但凡JVM想要调用硬件的一些操作，它就得通过操作系统。
现在终于要讲到JVM的体系结构了，我先给出JVM的体系结构图，JVM的体系结构如下图所示。
在这里插入图片描述

类加载器

类装载器（ClassLoader）负责加载class文件，class文件在文件开头有特定的文件标示，并且ClassLoader只负责class文件的加载，至于它是否可以运行，则由Execution Engine决定。
在这里插入图片描述
类装载器加载class文件之后，就会形成一个元数据模板（即Class），元数据模板中存放的是共性数据，你有没有想过元数据模板是放在哪儿？new出来的这些实例又是放在哪儿呢？这个问题先放在这儿，学到后面，你自然就知道答案了。
JVM虚拟机中自带的类加载器一共有四种，它们分别是：
在这里插入图片描述
讲到这儿，我也不接着往下面讲了，先看一个案例，你觉得下面的Java程序运行之后会输出什么呢？

以上Java程序运行之后输出为null，为什么会这样呢？因为Object类是由启动类加载器加载进内存的，而启动类加载器不是Java的，是C++的，所以获得到的结果为null。
在学习类加载器时，我们肯定会学一个双亲委派机制，啥是双亲委派机制呢？即自顶向下加载，这样可以保证代码的安全性，防止恶意代码对源代码的修改。说得大白话一点，就是但凡出问题了，别来找我，找我爸，一层一层往上找，如下图所示。
在这里插入图片描述
下面我会举一个案例，来加深对双亲委派机制的理解。你觉得下面的Java程序运行之后会输出什么呢？

以上Java程序运行之后输出的结果如下图所示。

从以上运行结果中，我们可以清楚地看到JVM中类加载器的层级结构，即自顶向下依次是些什么类加载器。
在学习类加载器时，我们还会学一个沙箱安全机制，啥是沙箱安全机制呢？即保护程序安全的。说得大白话一点，就是保护自己的原生JDK的那些代码。这里我也会举个例子来加深对沙箱安全机制的理解。在我们本机上安装的JDK中有一个原生的String类，这一点可以从下图中看出来。
在这里插入图片描述
如果我们同样自定义一个String类，就像下图所示的那样。

运行以上程序时，发现报错了，这正是因为沙箱安全机制引起的，也就说明了它保护了原生JDK的那些代码。

执行引擎

执行引擎（Execution Engine）负责解释命令，并提交给操作系统执行。

Native

Native Interface（本地接口）

本地接口的作用是融合不同的编程语言为Java所用，它的初衷是融合C/C++程序，Java诞生的时候是C/C++横行的时候，它要想立足，就必须要调用C/C++程序，于是就在内存中专门开辟了一块区域处理标记为native的代码，它的具体做法是Native Method Stack中登记native方法，在Execution Engine执行时加载native libraies。
目前该方法使用的越来越少了，除非是与硬件有关的应用，比如通过Java程序驱动打印机或者Java系统管理生产设备，在企业级应用中已经比较少见了。因为现在的异构领域间的通信很发达，比如可以使用Socket通信，也可以使用WebService等等，故在这里并不多做介绍。

Native Method Stack（本地方法栈）

上面已经讲过了，Java在诞生时就在内存中专门开辟了一块区域处理标记为native的代码，它的具体做法是Native Method Stack中登记native方法，在Execution Engine执行时加载本地方法库。
对此，我的理解是：本地方法栈（Native Method Stack）限定只有标注了native的方法才能塞进去。塞进去的方法但凡想要被执行，就只能求助于操作系统，然后调本地方法接口（操作系统的），调用本地方法接口时还需要本地方法库（类似于jar包，即dll动态连接库）的支持，最后，本地方法想要运行，还得把这个方法先做一个入栈的操作。
你试着想一下下面的Java程序运行到new Thread().start();这儿时，新的线程起来了没有呢？
在这里插入图片描述
答案是不确定线程起来没起来！因为是操作系统去起这个线程，这跟什么语言是无关的。如果你有心的话，那么可以查看一下Thread类的start()方法的源码，会发现其中有一个start0()方法的声明，而它就是一个native方法。
在这里插入图片描述
但凡标注了native的方法（也即本地方法），Java是无能为力了，这不是Java能做的事情，要交给操作系统了，这是操作系统要做的事情。

PC寄存器

每个线程都有一个程序计数器，它是线程私有的，其实它就是一个指针，指向方法区中的方法字节码（用来存储指向下一条指令的地址，也即将要执行的指令代码），由执行引擎读取下一条指令，是一个非常小的内存空间，几乎可以忽略不记。温馨提示：PC寄存器（程序计数器）不是用来做存储的，而是用来做计算的。
那么，PC寄存器到底在哪儿用呢？别急，后面我会介绍到！

方法区

方法区是被所有线程共享的，所有字段和方法字节码，以及一些特殊方法如构造函数、接口代码等也在此定义。简单说，所有定义的方法的信息都保存在该区域，此区属于共享区间。
类加载器把.class文件读到内存里面变成Class（元数据模板）之后，变成的Class（元数据模板）就存放在方法区里面，相应地，所有的Class（元数据模板）包含的信息都会放进去，包含的信息如下图所示。
在这里插入图片描述
小结：公共的不变的通通放到方法区中，而各自独有的放到堆或栈中。但是，实例变量存在堆内存中，和方法区无关。
这里有一个问题，什么才能把方法区这部分内存回收掉呢？在JVM停下来的时候，才会回收！除此之外，我们还得知道一点，那就是只要是所有线程共享的才可以回收或者优化，如果是线程私有的则便不可以被回收或者优化。

栈

我们都知道，程序=数据结构+算法，但这是一个正确的废话。在真实开发中，真正的程序开发是这样色的：程序=业务需求+框架。讲到栈，必然要讲到数据结构，因为栈是数据结构中的一种，简单的数据结构有：
在这里插入图片描述
接下来，我会对栈做一个详细的介绍。

栈是什么呢？

栈是什么呢？栈也叫栈内存，主管Java程序的运行，是在线程创建时创建，它的生命期是跟随线程的生命期的，线程结束栈内存也就释放了，对于栈来说不存在垃圾回收问题，只要线程一结束该栈就Over了，它的生命周期和线程是一致的，且它是线程私有的。其中，8种基本类型的变量+对象的引用变量+实例方法都是在函数的栈内存中分配的。
你有没想过，栈存储什么呢？也就是说栈帧中主要存储的都是些什么玩意呢？啥是栈帧呢？说得通俗点，栈帧就相当于弹夹里面的一个一个子弹。
在这里插入图片描述
栈帧中主要保存3类数据，如下图所示。

栈的运行原理

栈中的数据都是以栈帧（Stack Frame）的格式存在的，栈帧是一个内存区块，是一个数据集，也是一个有关方法（Method）和运行期数据的数据集，当一个方法A被调用时就产生了一个栈帧F1，并被压入到栈中，A方法又调用了B方法，于是又产生栈帧F2并也被压入栈中，B方法又调用了C方法，于是又会产生栈帧F3被压入栈中，…。执行完毕后，先弹出F3栈帧，再弹出F2栈帧，再弹出F1栈帧…。
说白了，栈的运行原理就一句话，即先进后出或者后进先出。这里，我会举一个例子，以此加深对栈的运行原理的理解。观察以下Java程序，你能粗略地画出栈的内存示意图吗？
在这里插入图片描述
下图是我根据以上Java程序画出的栈的内存示意图，画的很丑，望大家见谅！

问题来了，你怎么知道执行完test02方法后，下面该执行谁呢？想一想，是不是应该有个从一个方法指向另一个方法的指针，这个指针就是PC寄存器（线程私有的，PC寄存器就在栈中）。
在这里插入图片描述
当一个方法被调用时便会产生了一个栈帧，并被压入到栈中，那么当一个栈帧出栈时，就相当于一个方法执行完毕了。更加详细的栈的内存结构如下图所示。

从上图中可以清楚地看出，在一个栈中有两个栈帧，栈帧2是最先被调用的方法，故先入栈，然后方法2又调用了方法1，故栈帧1处于栈顶的位置，栈帧2处于栈底，执行完毕后，依次弹出栈帧1和栈帧2，线程结束，栈即刻释放。可以得出结论：每执行一个方法都会产生一个栈帧，保存到栈（后进先出）的顶部，顶部栈就是当前的方法，该方法执行完毕后会自动将此栈帧出栈。
在这里插入图片描述

什么是StackOverflowError？有哪些方法分析？

知道了栈的运行原理之后，我们就可以解决一开始提出的一个面试题了，即什么是StackOverflowError？（随之而来的问题：它是由什么原因引起的？你是怎么去定位的？又是怎么去解决的？）有哪些方法分析？
如果在方法中自己调用自己，也即循环递归调用，在这种情况下就会一直往里压栈，一直不出栈，那么此时就会报java.lang.StackOverflowError的错了。
在这里插入图片描述
运行以上Java程序，你便可以在Eclipse控制台看到java.lang.StackOverflowError的错误信息了。

这时，我们可以定位到出现java.lang.StackOverflowError错误的那句代码处了，发现出现了循环递归调用的情况，知道原因就好解决了。温馨提示：java.lang.StackOverflowError这个错误，我们必须记下来，除此之外，还要搞清楚它到底是由什么原因引起的？我们该怎么去定位？怎么去解决？

栈、堆以及方法区之间的交互关系

栈、堆以及方法区之间的交互关系如下图所示。
在这里插入图片描述
有同学可能会问，HotSpot是个什么东西啊？HotSpot就是JDK的品牌名（产品名）。JVM就是一套规范，HotSpot就是根据JVM的这套规范生成的一个产品。你是不是在哪儿看到过这个东西呢？

这里，稍微简单了解一下Java（JDK）的发展历史，在Java发展的过程中，有三种JVM，它们分别是：
在这里插入图片描述

堆体系结构

堆是JVM体系结构中最复杂、最重要的模块，通常所说的JVM调优调的就是堆（内存）。下面我会对堆做一个详细的介绍。

堆是什么呢？

一个JVM实例只存在一个堆内存，堆内存的大小是可以调节的。类加载器读取了类文件后，需要把类、方法、常变量放到堆内存中，保存所有引用类型的真实信息，以方便执行器执行。堆内存可分为三部分，它们分别是：
在这里插入图片描述

堆的组成部分

在Java7及之前，堆内存在逻辑上可分为三部分，即新生区+养老区+永久区，不过在Java8之后变成了新生区+养老区+元空间。这里，就先以Java7中的堆内存为例来讲述。
在这里插入图片描述
下面我会对新生区、养老区以及永久区这三个区做一个详细的介绍。

新生区

新生区是类的诞生、成长、消亡的区域，一个类在这里产生，应用，最后被垃圾回收器收集，结束生命。新生区又分为两部分：伊甸区（Eden Space）和幸存者区（Survivor Space），所有的类都是在伊甸区被new出来的。幸存区有两个：0区（Survivor 0 Space）和1区（Survivor 1 Space）。当伊甸区的空间用完时，程序又需要创建对象，JVM的垃圾回收器将对伊甸区进行垃圾回收 （即Minor GC），将伊甸区中的不再被其他对象所引用的对象进行销毁，然后将伊甸区中的剩余对象移动到幸存0区。若幸存0区也满了，再对该区进行垃圾回收，然后移动到1区。那如果1区也满了呢？再移动到养老区。若养老区也满了，那么这个时候将产生Major GC（也即Full GC），进行养老区的内存清理。若养老区执行了Full GC之后发现依然无法进行对象的保存，就会产生OOM异常（也即OutOfMemoryError，内存溢出错误）。
上面的这一大段话，其实还算是蛮好理解的，当然了，我怕有些同学看不懂，特意画了下面一个图帮助理解。
在这里插入图片描述
如果出现了java.lang.OutOfMemoryError: Java heap space异常，那么就说明了Java虚拟机的堆内存不够。导致该异常的原因有二：

1）Java虚拟机的堆内存设置不够，可以通过参数-Xms（调整初始内存大小）、-Xmx（调整最大内存大小）来调整；
2）代码中创建了大量大对象，并且长时间不能被垃圾收集器收集（存在被引用）。

试着运行一下以下Java程序，你觉得会是什么情况？
在这里插入图片描述
如果运行以上Java程序，那么你便可以在Eclipse控制台看到java.lang.OutOfMemoryError: Java heap space这个错误信息了。

你不仅会想，在以上Java程序中，也没有抓住内存溢出这个错误啊！确实是这样，如果真想抓住这个错误，那么可以使用Throwable来抓到这个内存溢出错误。
在这里插入图片描述
此时，运行以上Java程序，你便可以在Eclipse控制台看到如下打印信息了。

上面我业已讲过，在Java7及之前，堆内存在逻辑上可分为三部分，即新生区+养老区+永久区。那么在真实物理上是如何划分的呢？在物理上分为两块，即New/Young+Old。
在这里插入图片描述
关于堆在真实物理上的划分，我们要注意以下两点。

永久区对应的是方法区，而不是在堆里面（真实物理上）。永久区与方法区之间的关系是：永久区就是方法区的一个具体实现，而方法区就是一个接口；
新生区中的伊甸区、幸存0区以及幸存1区的比例是8:1:1。

在真实物理划分上，新生区分为两部分：伊甸区（Eden Space）和幸存者区（Survivor Space），其中，幸存区有两个：0区（Survivor 0 Space）和1区（Survivor 1 Space）。这不仅可以从上图中可以看出，而且也可以从下图中看出。
在这里插入图片描述
那么你又知不知道，幸存0区可以叫做幸存from/to区，幸存1区也可以叫幸存to/from区呢？紧接着，问题来了，你怎么判断谁是幸存from区，谁是幸存to区呢？很简单，一句口诀搞定——复制必交换，谁空谁是to（即to区总为空）。

养老区

养老区在真实物理上的划分如下图所示。
在这里插入图片描述
什么样的对象会进入到养老区中呢？所有的池对象（包括连接池、线程池）经历多次GC都会进入到养老区中，而且养老区还有Full GC，但凡相应的对象不用了，也可以通过Full GC回收回来。

永久区

永久存储区是一个常驻内存区域，用于存放JDK自身所携带的Class、Interface的元数据，也就是说它存储的是运行环境必须的类信息，被装载进此区域的数据是不会被垃圾回收器回收掉的，关闭JVM才会释放此区域所占用的内存。
如果出现java.lang.OutOfMemoryError: PermGen space异常，那么说明是Java虚拟机对永久代Perm内存设置不够。一般出现这种情况，都是程序启动需要加载大量的第三方jar包。例如，在一个Tomcat下部署了太多的应用，或者大量动态反射生成的类不断被加载，最终导致Perm区被占满。
有一点我们需要注意，JVM一直是在更新的，这一点可以从下图中看出来。
在这里插入图片描述
我们知道，堆在真实物理的划分上，永久区对应的是方法区，所以，我们还得说说方法区。实际而言，方法区（Method Area） 和堆一样，是各个线程共享的内存区域，它用于存储虚拟机加载的类信息+普通常量+静态常量+编译器编译后的代码等等，虽然JVM规范将方法区描述为堆的一个逻辑部分，但是它还有一个别名叫做Non-Heap（非堆），目的就是要和堆分开。
对于HotSpot虚拟机而言，很多开发者习惯将方法区称之为 “永久代(Parmanent Gen)”，一个是逻辑部分，一个是物理部分！但严格本质上说两者不同，或者说使用永久代来实现方法区而已，永久代是方法区（相当于是一个Interface接口）的一个实现，在JDK1.7的版本中，已经将原本放在永久代的字符串常量池移走了。
上面讲到了常量池，常量池是个什么东东呢？常量池（Constant Pool）是方法区的一部分，Class文件除了有类的版本、字段、方法、接口等描述信息外，还有一项信息就是常量池，这部分内容将在类加载后进入方法区的运行时常量池中存放。
在这里插入图片描述

小结

只有熟悉了堆内存中的三区结构后，才可学习JVM垃圾收集机制；
现在，你可不可以回答这样一个面试题了，即请谈谈你对JVM的理解？Java8的虚拟机有什么更新？关于对JVM的理解，这里我就不再赘述了，只谈谈Java8的虚拟机有什么更新。Java8及之后JVM的变化：无永久代，常量池1.8在元空间（无永久区了，取而代之的是元空间，但元空间依然在方法区里面。一个方法区接口有两个普通实现，一个是永久区，一个是元空间）。