快速入门JVM第一讲——JVM体系结构概述

本文是作者对JVM快速入门的学习笔记,详细介绍了JVM的体系结构,包括类加载器、执行引擎、本地接口、PC寄存器、方法区和栈。文章探讨了类加载器的双亲委派机制、执行引擎的功能、本地方法栈的作用,以及堆、栈和方法区的内存管理,特别是如何理解和解决StackOverflowError和OutOfMemoryError。通过对JVM的学习,读者可以更好地理解Java程序的运行机制和内存管理。
摘要由CSDN通过智能技术生成

相信学过Java的同学,都应该晓得JVM,它几乎是面试中必问的知识点。要想成为一名合格的Java程序员,JVM是你必须要掌握的知识点,它的重要性就不言而喻了。笔者本人也只是刚刚好入了JVM的门槛,多少对它有了一定的了解,本文详细记录了笔者本人快速入门JVM的学习过程,希望对初次学习JVM的同学有一定的借鉴之处!

JVM体系结构

在讲述JVM体系结构之前,先来看如下几道面试题,你能解决几道面试题呢?

  • 请谈谈你对JVM的理解?Java8的虚拟机有什么更新?
  • 什么是OOM?(随之而来的问题:它是由什么原因引起的?你是怎么去定位的?又是怎么去解决的?)什么是StackOverflowError?有哪些方法分析?
  • JVM的常用参数调优你知道哪些?
  • 内存快照抓取和MAT(但凡出现了OOM,你是怎么去定位的?常用的工具就是MAT)分析DUMP文件知道吗?
  • 谈谈JVM中,对类加载器你的认识?

初次学习JVM的同学,想必都会很懵逼,这些面试题一个也不会啊!没有关系,如果你能跟随我的脚步快速入门JVM,那么相信在你心中一定知道了以上面试题的答案。
在讲述JVM体系结构之前,你还得知道JVM所处的位置,如下图所示。
在这里插入图片描述
从上图中我们可以看出,JVM是运行在操作系统之上的,它与硬件没有直接的交互,但凡JVM想要调用硬件的一些操作,它就得通过操作系统。
现在终于要讲到JVM的体系结构了,我先给出JVM的体系结构图,JVM的体系结构如下图所示。
在这里插入图片描述

类加载器

类装载器(ClassLoader)负责加载class文件,class文件在文件开头有特定的文件标示,并且ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定。
在这里插入图片描述
类装载器加载class文件之后,就会形成一个元数据模板(即Class),元数据模板中存放的是共性数据,你有没有想过元数据模板是放在哪儿?new出来的这些实例又是放在哪儿呢?这个问题先放在这儿,学到后面,你自然就知道答案了。
JVM虚拟机中自带的类加载器一共有四种,它们分别是:
在这里插入图片描述
讲到这儿,我也不接着往下面讲了,先看一个案例,你觉得下面的Java程序运行之后会输出什么呢?
在这里插入图片描述
以上Java程序运行之后输出为null,为什么会这样呢?因为Object类是由启动类加载器加载进内存的,而启动类加载器不是Java的,是C++的,所以获得到的结果为null。
在学习类加载器时,我们肯定会学一个双亲委派机制,啥是双亲委派机制呢?即自顶向下加载,这样可以保证代码的安全性,防止恶意代码对源代码的修改。说得大白话一点,就是但凡出问题了,别来找我,找我爸,一层一层往上找,如下图所示。
在这里插入图片描述
下面我会举一个案例,来加深对双亲委派机制的理解。你觉得下面的Java程序运行之后会输出什么呢?
在这里插入图片描述
以上Java程序运行之后输出的结果如下图所示。
在这里插入图片描述
从以上运行结果中,我们可以清楚地看到JVM中类加载器的层级结构,即自顶向下依次是些什么类加载器。
在学习类加载器时,我们还会学一个沙箱安全机制,啥是沙箱安全机制呢?即保护程序安全的。说得大白话一点,就是保护自己的原生JDK的那些代码。这里我也会举个例子来加深对沙箱安全机制的理解。在我们本机上安装的JDK中有一个原生的String类,这一点可以从下图中看出来。
在这里插入图片描述
如果我们同样自定义一个String类,就像下图所示的那样。
在这里插入图片描述
运行以上程序时,发现报错了,这正是因为沙箱安全机制引起的,也就说明了它保护了原生JDK的那些代码。

执行引擎

执行引擎(Execution Engine)负责解释命令,并提交给操作系统执行。

Native

Native Interface(本地接口)

本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序,Java诞生的时候是C/C++横行的时候,它要想立足,就必须要调用C/C++程序,于是就在内存中专门开辟了一块区域处理标记为native的代码,它的具体做法是Native Method Stack中登记native方法,在Execution Engine执行时加载native libraies。
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见了。因为现在的异构领域间的通信很发达,比如可以使用Socket通信,也可以使用WebService等等,故在这里并不多做介绍。

Native Method Stack(本地方法栈)

上面已经讲过了,Java在诞生时就在内存中专门开辟了一块区域处理标记为native的代码,它的具体做法是Native Method Stack中登记native方法,在Execution Engine执行时加载本地方法库。
对此,我的理解是:本地方法栈(Native Method Stack)限定只有标注了native的方法才能塞进去。塞进去的方法但凡想要被执行,就只能求助于操作系统,然后调本地方法接口(操作系统的),调用本地方法接口时还需要本地方法库(类似于jar包,即dll动态连接库)的支持,最后,本地方法想要运行,还得把这个方法先做一个入栈的操作。
你试着想一下下面的Java程序运行到new Thread().start();这儿时,新的线程起来了没有呢?
在这里插入图片描述
答案是不确定线程起来没起来!因为是操作系统去起这个线程,这跟什么语言是无关的。如果你有心的话,那么可以查看一下Thread类的start()方法的源码,会发现其中有一个start0()方法的声明,而它就是一个native方法。
在这里插入图片描述
但凡标注了native的方法(也即本地方法),Java是无能为力了,这不是Java能做的事情,要交给操作系统了,这是操作系统要做的事情。

PC寄存器

每个线程都有一个程序计数器,它是线程私有的,其实它就是一个指针,指向方法区中的方法字节码(用来存储指向下一条指令的地址,也即将要执行的指令代码),由执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不记。温馨提示:PC寄存器(程序计数器)不是用来做存储的,而是用来做计算的。
那么,PC寄存器到底在哪儿用呢?别急,后面我会介绍到!

方法区

方法区是被所有线程共享的,所有字段和方法字节码,以及一些特殊方法如构造函数、接口代码等也在此定义。简单说,所有定义的方法的信息都保存在该区域,此区属于共享区间。
类加载器把.class文件读到内存里面变成Class(元数据模板)之后,变成的Class(元数据模板)就存放在方法区里面,相应地,所有的Class(元数据模板)包含的信息都会放进去,包含的信息如下图所示。
在这里插入图片描述
小结:公共的不变的通通放到方法区中,而各自独有的放到堆或栈中。但是,实例变量存在堆内存中,和方法区无关。
这里有一个问题,什么才能把方法区这部分内存回收掉呢?在JVM停下来的时候,才会回收!除此之外,我们还得知道一点,那就是只要是所有线程共享的才可以回收或者优化,如果是线程私有的则便不可以被回收或者优化。

我们都知道,程序=数据结构+算法,但这是一个正确的废话。在真实开发中,真正的程序开发是这样色的:程序=业务需求+框架。讲到栈,必然要讲到数据结构,因为栈是数据结构中的一种,简单的数据结构有:
在这里插入图片描述
接下来,我会对栈做一个详细的介绍。

栈是什么呢?

栈是什么呢?栈也叫栈内存,主管Java程序的运行,是在线程创建时创建,它的生命期是跟随线程的生命期的,线程结束栈内存也就释放了,对于栈来说不存在垃圾回收问题,只要线程一结束该栈就Over了,它的生命周期和线程是一致的,且它是线程私有的。其中,8种基本类型的变量+对象的引用变量+实例方法都是在函数的栈内存中分配的。
你有没想过,栈存储什么呢?也就是说栈帧中主要存储的都是些什么玩意呢?啥是栈帧呢?说得通俗点,栈帧就相当于弹夹里面的一个一个子弹。
在这里插入图片描述
栈帧中主要保存3类数据,如下图所示。
在这里插入图片描述

栈的运行原理

栈中的数据都是以栈帧(Stack Frame)的格式存在的,栈帧是一个内存区块,是一个数据集,也是一个有关方法(Method)和运行期数据的数据集,当一个方法A被调用时就产生了一个栈帧F1,并被压入到栈中,A方法又调用了B方法,于是又产生栈帧F2并也被压入栈中,B方法又调用了C方法,于是又会产生栈帧F3被压入栈中,…。执行完毕后,先弹出F3栈帧,再弹出F2栈帧,再弹出F1栈帧…。
说白了,栈的运行原理就一句话,即先进后出或者后进先出。这里,我会举一个例子,以此加深对栈的运行原理的理解。观察以下Java程序,你能粗略地画出栈的内存示意图吗?
在这里插入图片描述
下图是我根据以上Java程序画出的栈的内存示意图,画的很丑,望大家见谅!
在这里插入图片描述
问题来了,你怎么知道执行完test02方法后,下面该执行谁呢?想一想,是不是应该有个从一个方法指向另一个方法的指针,这个指针就是PC寄存器(线程私有的,PC寄存器就在栈中)。
在这里插入图片描述
当一个方法被调用时便会产生了一个栈帧,并被压入到栈中,那么当一个栈帧出栈时,就相当于一个方法执行完毕了。更加详细的栈的内存结构如下图所示。
在这里插入图片描述
从上图中可以清楚地看出,在一个栈中有两个栈帧,栈帧2是最先被调用的方法,故先入栈,然后方法2又调用了方法1,故栈帧1处于栈顶的位置,栈帧2处于栈底,执行完毕后,依次弹出栈帧1和栈帧2,线程结束,栈即刻释放。可以得出结论:每执行一个方法都会产生一个栈帧,保存到栈(后进先出)的顶部,顶部栈就是当前的方法,该方法执行完毕后会自动将此栈帧出栈。
在这里插入图片描述

什么是StackOverflowError?有哪些方法分析?

知道了栈的运行原理之后,我们就可以解决一开始提出的一个面试题了,即什么是StackOverflowError?(随之而来的问题:它是由什么原因引起的?你是怎么去定位的?又是怎么去解决的?)有哪些方法分析?
如果在方法中自己调用自己,也即循环递归调用,在这种情况下就会一直往里压栈,一直不出栈,那么此时就会报java.lang.StackOverflowError的错了。
在这里插入图片描述
运行以上Java程序,你便可以在Eclipse控制台看到java.lang.StackOverflowError的错误信息了。
在这里插入图片描述
这时,我们可以定位到出现java.lang.StackOverflowError错误的那句代码处了,发现出现了循环递归调用的情况,知道原因就好解决了。温馨提示:java.lang.StackOverflowError这个错误,我们必须记下来,除此之外,还要搞清楚它到底是由什么原因引起的?我们该怎么去定位?怎么去解决?

栈、堆以及方法区之间的交互关系

栈、堆以及方法区之间的交互关系如下图所示。
在这里插入图片描述
有同学可能会问,HotSpot是个什么东西啊?HotSpot就是JDK的品牌名(产品名)。JVM就是一套规范,HotSpot就是根据JVM的这套规范生成的一个产品。你是不是在哪儿看到过这个东西呢?
在这里插入图片描述
这里,稍微简单了解一下Java(JDK)的发展历史,在Java发展的过程中,有三种JVM,它们分别是:
在这里插入图片描述

堆体系结构

堆是JVM体系结构中最复杂、最重要的模块,通常所说的JVM调优调的就是堆(内存)。下面我会对堆做一个详细的介绍。

堆是什么呢?

一个JVM实例只存在一个堆内存,堆内存的大小是可以调节的。类加载器读取了类文件后,需要把类、方法、常变量放到堆内存中,保存所有引用类型的真实信息,以方便执行器执行。堆内存可分为三部分,它们分别是:
在这里插入图片描述

堆的组成部分

在Java7及之前,堆内存在逻辑上可分为三部分,即新生区+养老区+永久区,不过在Java8之后变成了新生区+养老区+元空间。这里,就先以Java7中的堆内存为例来讲述。
在这里插入图片描述
下面我会对新生区、养老区以及永久区这三个区做一个详细的介绍。

新生区

新生区是类的诞生、成长、消亡的区域,一个类在这里产生,应用,最后被垃圾回收器收集,结束生命。新生区又分为两部分:伊甸区(Eden Space)和幸存者区(Survivor Space),所有的类都是在伊甸区被new出来的。幸存区有两个:0区(Survivor 0 Space)和1区(Survivor 1 Space)。当伊甸区的空间用完时,程序又需要创建对象,JVM的垃圾回收器将对伊甸区进行垃圾回收 (即Minor GC),将伊甸区中的不再被其他对象所引用的对象进行销毁,然后将伊甸区中的剩余对象移动到幸存0区。若幸存0区也满了,再对该区进行垃圾回收,然后移动到1区。那如果1区也满了呢?再移动到养老区。若养老区也满了,那么这个时候将产生Major GC(也即Full GC),进行养老区的内存清理。若养老区执行了Full GC之后发现依然无法进行对象的保存,就会产生OOM异常(也即OutOfMemoryError,内存溢出错误)
上面的这一大段话,其实还算是蛮好理解的,当然了,我怕有些同学看不懂,特意画了下面一个图帮助理解。
在这里插入图片描述
如果出现了java.lang.OutOfMemoryError: Java heap space异常,那么就说明了Java虚拟机的堆内存不够。导致该异常的原因有二:

  • 1)Java虚拟机的堆内存设置不够,可以通过参数-Xms(调整初始内存大小)、-Xmx(调整最大内存大小)来调整;
  • 2)代码中创建了大量大对象,并且长时间不能被垃圾收集器收集(存在被引用)。

试着运行一下以下Java程序,你觉得会是什么情况?
在这里插入图片描述
如果运行以上Java程序,那么你便可以在Eclipse控制台看到java.lang.OutOfMemoryError: Java heap space这个错误信息了。
在这里插入图片描述
你不仅会想,在以上Java程序中,也没有抓住内存溢出这个错误啊!确实是这样,如果真想抓住这个错误,那么可以使用Throwable来抓到这个内存溢出错误。
在这里插入图片描述
此时,运行以上Java程序,你便可以在Eclipse控制台看到如下打印信息了。
在这里插入图片描述
上面我业已讲过,在Java7及之前,堆内存在逻辑上可分为三部分,即新生区+养老区+永久区。那么在真实物理上是如何划分的呢?在物理上分为两块,即New/Young+Old。
在这里插入图片描述
关于堆在真实物理上的划分,我们要注意以下两点。

  1. 永久区对应的是方法区,而不是在堆里面(真实物理上)。永久区与方法区之间的关系是:永久区就是方法区的一个具体实现,而方法区就是一个接口;
  2. 新生区中的伊甸区、幸存0区以及幸存1区的比例是8:1:1。

在真实物理划分上,新生区分为两部分:伊甸区(Eden Space)和幸存者区(Survivor Space),其中,幸存区有两个:0区(Survivor 0 Space)和1区(Survivor 1 Space)。这不仅可以从上图中可以看出,而且也可以从下图中看出。
在这里插入图片描述
那么你又知不知道,幸存0区可以叫做幸存from/to区,幸存1区也可以叫幸存to/from区呢?紧接着,问题来了,你怎么判断谁是幸存from区,谁是幸存to区呢?很简单,一句口诀搞定——复制必交换,谁空谁是to(即to区总为空)

养老区

养老区在真实物理上的划分如下图所示。
在这里插入图片描述
什么样的对象会进入到养老区中呢?所有的池对象(包括连接池、线程池)经历多次GC都会进入到养老区中,而且养老区还有Full GC,但凡相应的对象不用了,也可以通过Full GC回收回来。

永久区

永久存储区是一个常驻内存区域,用于存放JDK自身所携带的Class、Interface的元数据,也就是说它存储的是运行环境必须的类信息,被装载进此区域的数据是不会被垃圾回收器回收掉的,关闭JVM才会释放此区域所占用的内存。
如果出现java.lang.OutOfMemoryError: PermGen space异常,那么说明是Java虚拟机对永久代Perm内存设置不够。一般出现这种情况,都是程序启动需要加载大量的第三方jar包。例如,在一个Tomcat下部署了太多的应用,或者大量动态反射生成的类不断被加载,最终导致Perm区被占满。
有一点我们需要注意,JVM一直是在更新的,这一点可以从下图中看出来。
在这里插入图片描述
我们知道,堆在真实物理的划分上,永久区对应的是方法区,所以,我们还得说说方法区。实际而言,方法区(Method Area) 和堆一样,是各个线程共享的内存区域,它用于存储虚拟机加载的类信息+普通常量+静态常量+编译器编译后的代码等等,虽然JVM规范将方法区描述为堆的一个逻辑部分,但是它还有一个别名叫做Non-Heap(非堆),目的就是要和堆分开。
对于HotSpot虚拟机而言,很多开发者习惯将方法区称之为 “永久代(Parmanent Gen)”,一个是逻辑部分,一个是物理部分!但严格本质上说两者不同,或者说使用永久代来实现方法区而已,永久代是方法区(相当于是一个Interface接口)的一个实现,在JDK1.7的版本中,已经将原本放在永久代的字符串常量池移走了。
上面讲到了常量池,常量池是个什么东东呢?常量池(Constant Pool)是方法区的一部分,Class文件除了有类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池,这部分内容将在类加载后进入方法区的运行时常量池中存放。
在这里插入图片描述

小结
  1. 只有熟悉了堆内存中的三区结构后,才可学习JVM垃圾收集机制;
  2. 现在,你可不可以回答这样一个面试题了,即请谈谈你对JVM的理解?Java8的虚拟机有什么更新?关于对JVM的理解,这里我就不再赘述了,只谈谈Java8的虚拟机有什么更新。Java8及之后JVM的变化:无永久代,常量池1.8在元空间(无永久区了,取而代之的是元空间,但元空间依然在方法区里面。一个方法区接口有两个普通实现,一个是永久区,一个是元空间)。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李阿昀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值