七、JVM从入门到精通之对象实例化过程

最新推荐文章于 2024-05-02 02:25:22 发布

猿小许

最新推荐文章于 2024-05-02 02:25:22 发布

阅读量1.8k

点赞数

分类专栏： JVM从入门到精通文章标签： jvm 对象的实例化过程 Java

本文链接：https://blog.csdn.net/weixin_44205087/article/details/121486154

版权

JVM从入门到精通专栏收录该内容

10 篇文章 0 订阅

订阅专栏

hello ,大家好，我是猿小许呀！上一篇中我们将运行时数据区的方法区做了详细的讲解说明，接下来我们会分析对象的实例化过程做出详解，Are you ready?
👉👉👉 go!

一、对象的实例化

在这里插入图片描述

1.1 创建对象的步骤

在这里插入图片描述

1.1.1 判断对象对应的类是否加载、链接、初始化

虚拟机遇到一条new 指令，首先去检查这个指令的参数能否在Metaspace的常量池中定位到一个类的符合引用，并且检查这个符号引用代表的类是否已经被加载、解析和初始化。（即判断类元信息是否存在）。如果没有，那么在双亲委派机制下，使用当前类加载器以ClassLoader+包名+类名为Key进行查找对应的.class文件，如果没有找到文件，则抛出ClassLoaderFoundExcetion异常，如果找到，则进行类加载，并生成对应的Class类对象

1.1.2 为对象分配内存

首先计算对象占用空间大小，接着在堆中划分一块内存给新对象。如果实例成员变量是引用变量，仅分配引用变量空间即可，即4个字节大小。

package com.jvmTest.userClassLoader;

public class SimpleClass{
    public void sayHello(){
        int x=2;   //int 占用4个字节
        double d=0.22; //double 占用8个字节
        String str="hello";  // 引用类型占用4个字节
        User user = new User();// 引用类型占用4个字节

    }
}

class User{
    String name="lisi";
    int age=18;
}

整型： int 4个字节；short 2个字节； long 8个字节；byte 1个字节
浮点型： float 4个字节； double 8个字节
char类型： char 2个字节
boolean类型： boolean 1个字节

判断内存是否规整

内存如果规整：
如果内存是规整的，那么虚拟机将采用的是指针碰撞法（Bump the Pointer)来为对象分配内存。意思是所有用过的内存在一边，空闲的内存在另一边，中间放着一个指针作为分界点的指示器，分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离罢了。如果垃圾回收器选择的是Serial、ParNew这种基于压缩算法的，虚拟机采用这种分配方式，一般使用带有compac1（整理）过程的收集器时，使用指针碰撞。

内存如果不规整：
如果内存不是规整的，已使用的内存和未使用的内存相互交替，那么虚拟机将采用的是空闲列表法来为对象分配内存。
意思是虚拟机维护了一个列表，记录上哪些内存块是可用的，再分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的内容，这种分配方式成为“空闲列表”

1.1.3 处理并发安全问题

采用CAS失败重试、区域加锁保证更新的原子性
每个线程先分配一块TLAB—通过-XX:+/-UseTLAB参数来设定

1.1.4 初始化分配的空间

所有属性设置默认值，保证对象实例字段在不赋值时可以直接使用

1.1.5 设置对象的对象头

将对象的所属类（即类的元数据信息）、对象的HashCode和对象的GC信息、锁信息等数据存储，在对象的对象头中，这个过程的具体设置方式取决于JVM实现。

1.1.6 执行init方法

在java程序的视角来看，初始化才正式开始，初始化成员变量，执行实例化代码块，调用类的构造方法，并把堆内对象的首地址赋值给引用变量。
因此一般来说（由字节码中是否跟随有invokespecial指令所决定），new指令之后会接着就是执行方法，把对象按照程序的意愿进行初始化，这样一个真正可用的对象才算完全创建出来。

二、内存布局

我们都知道我们创建的对象都在堆中，对象在堆中是如何存储的，包括那几部分？下面我们做出说明。
在这里插入图片描述

2.1 对象头（Header)

包含两部分运行时元数据（Mark word) 和类型指针

运行时元数据（Mark word)

哈希值（HashCode)
GC分代年龄
锁状态标志
线程持有的锁
偏向线程ID
偏向时间戳

类型指针：
指向类元数据，确定该对象所属的类型

如果是数组，还需记录数组的长度

2.2 实例数据（instance Data)

说明： 他是对象真正存储的有效信息，包括程序代码中定义的各种类型的字段（包括父类继承下来的和本身拥有的字段）

规则：

相同宽度的字段总是分配在一起
父类中定义的变量会出现在子类之前
如果CompactFields参数为true（默认为true）子类的窄变量可能插入到父类变量的空袭

三、执行引擎

3.1 执行引擎概述

在这里插入图片描述

执行引擎是Java虚拟机核心的组成部分之一。
”虚拟机“是一个相对于“物理机”的概念，这两种机器都有代码执行能力，其区别是物理机的执行引擎是直接建立在处理器、缓存、指令集和操作系统层面上的，而虚拟机的执行引擎则由软件自行实现的，因此可以不受物理条件制约地定制指令集与执行引擎的结构体系，能够执行那些不被硬件直接支持的指令集格式。
JVM的主要任务是负责装载字节码到其内部，但字节码并不能够直接运行在操作系统之上，因为字节码指令并非等价于本地机器指令，它内部包含的仅仅只是一些能够被JVM所识别的字节码指令、符合表，以及其他辅助信息。
那么，如果想要让一个Java程序运行起来，执行引擎（Execution Engine)的任务就是将字节码指令解释/编译为对应平台上的本地机器指令才可以。简单来说，JVM的执行引擎充当了将高级语言翻译为机器语言的译者。

3.2 执行引擎的工作流程

在这里插入图片描述

💥执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于PC寄存器。
💥 每当执行完一项指令后，PC寄存器就会更新下一条需要被执行的指令地址。
💥 当然方法在执行的过程中，执行引擎有可能会通过存储在局部变量表中的对象引用准确定位到存储在Java堆区中的对象实例信息，以及通过对象头中的元数据指针定位到目标对象的类型信息。

3.3 Java代码编译和执行的过程

在这里插入图片描述

问题1：什么是解释器（Interpreter)，什么事JIT编译器？
解释器：当Java虚拟机启动时会根据预定义的规范对字节码采用逐行解释的方式执行，将每条字节码文件中的内容“翻译”为对应平台的本地机器指令执行。

JIT编译器（Just In Time Compiler):就是虚拟机将源代码直接编译成本地机器平台相关的机器语言。

问题2：为什么说Java是半编译半解释型语言？
JDK1.0时代，将Java语言定位为“解释执行”还是比较准确的，再后来，Java也发展出可以直接生成本地代码的编译器。
现在JVM在执行Java代码的时候，通常都会将解释器执行与编译执行二者结合起来进行。

问题3：JIT编译器编译后的代码在什么位置存储？

《深入理解Java虚拟机》书中对方法区（Method Area)存储内容描述如下：他用于存储已被虚拟机加载的类型信息，常量，静态变量，即时编译器编译后的代码缓存等。
在这里插入图片描述

3.4 机器码、指令、汇编语言

3.4.1 机器码

各种用二进制编码方式表示的指令，叫做机器指令码。开始，人们就用它编写程序，这就是机器语言。
机器语言虽然能够被计算机理解和接受，但和人们的语言差别太大，不易被人们理解和记忆，并且用它编程容易出差错。
用它编写的程序一经输入计算机，CPU直接读取运行，因此和其他语言遍的程序相比，执行速度最快。
机器指令与CPU紧密相关，所以不同种类的CPU所对应的机器指令也就不同。

3.4.2 指令

由于机器码是有0和1组成的二进制序列，可读性实在太差，于是人们发明了指令。
指令就是把机器码中特定的0和1序列，简化成对应的指令（一般为英文缩写，如mov，inc等），可读性稍好
由于不同的硬件平台，执行同一个操作，对应的机器码可能不同，所以不同的硬件平台的同一种指令（比如mov），对应的机器码也可能不同。

3.4.3 指令集

不同的硬件平台，各自支持的指令，是有差别的。因此每个平台所支持的指令，称之为对应平台的指令集。
如常见的：
X86指令集，对应的是X86架构的平台
ARM指令集，对应的是ARM架构的平台

3.4.5 汇编语言

由于指令的可读性还是太差，于是人们发明了汇编语言。
在汇编语言中，用助记符代替机器指令的操作码，用地址符号或标号代替指令或操作数的地址。
在不同的硬件平台，汇编语言对应着不同的机器语言指令集，通过汇编过程转换成机器指令。
由于计算机只认识指令码，所以汇编语言编写的程序还必须翻译成机器指令码，计算机才能识别和指令。

3.4.6 高级语言

为了使计算机用户编程序更容易些，后来就出现了各种高级计算机语言。高级语言比机器语言、汇编语言更接近人的语言。
当计算机执行高级语言编写的程序时，仍然需要把程序解释和编译成机器的指令码。完成这个过程的程序就叫做解释程序或者编译程序。

C、C++源程序执行过程

编译过程又可以分成两个阶段：编译和汇编。

编译过程：是读取源程序（字符流），对之进行词法和语法的分析，将高级语言指令转换为功能等效的汇编代码
汇编过程：实际上指把汇编语言代码翻译成目标指令的过程。

3.5 解释器

JVM设计者们的初衷仅仅只是单纯地为了满足Java程序实现跨平台特性，因此避免采用静态编译的方式直接生成本地机器指令，从而诞生了实现解释器在运行时采用逐行解释字节码程序的想法。

解释器真正意义上所承担的角色就是一个运行时‘翻译者“，将字节码文件中的内容”翻译“为对应平台的本地机器指令执行。
当一条字节码指令被解释执行完成后，接着再根据PC寄存器中记录的下一条需要被执行的字节码指令执行解释操作。

3.5.1 解释器分类

在Java的发展历史里，一共两套解释执行器，即古老的字节码解释器，现在普遍使用的模板解释器。

字节码解释器在执行时通过纯软件代码模拟字节码的执行，效率非常低下。
而模板解释器将一条字节码和一个模板函数相关联，模板函数中直接产生这条字节码执行时的机器码，从而很大程度上提高了解释器的性能。

3.5.2 解释器现状

由于解释器在设计和实现上非常简单，因此除了Java语言意外，还有许多高级语言同样也是基于解释器执行的，比如Python、Perl、Ruby等。但是今天，基于解释器执行已经沦落为低效的代名词，并且时常被一些C/C++程序员所调侃。
为了解决这个问题，JVM平台支持一种叫作即时编译器的技术，即时编译器的目的是避免函数被解释执行，而是将整个函数整体编译称为机器码，每次函数执行时，只执行编译后的机器码即可，这种方式可以使执行效率大幅度提升。
不过无论如何，基于解释器执行模式仍然为中间语言的发展做出了不可磨灭的贡献。

3.6 JIT（即时）编译器

在这里插入图片描述

HotSpot VM是目前市面上高性能虚拟机的代表作之一。它采用解释器与即时编译器并存的架构。在Java虚拟机运行时，解释器和即时编译器能够相互协作，各自取长补短，尽力去选择最合适的方式来权衡编译本地代码的时间和直接解释执行代码的时间。
在今天，Java程序员的运行性能早已脱胎换骨，已经达到了可以和C/C++程序一跤高下的地步了。

3.6.1 问题一：为什么有JIT编译器了还保留解释器

有些开发人员会感到诧异，既然HotSpot VM已经内置JIT编译器了，还为什么需要使用解释器来拖累程序的执行性能呢？比如JRockit VM内部就不包含解释器，字节码全部都依靠即时编译器编译后执行。

首先明确： 💥

当程序启动后，解释器可以马上发挥作用，省去编译的时间，立即执行。
编译器要想发挥作用，把代码编译成本地代码，需要一定的执行事件，但编译为本地代码后，执行效率高。

所以尽管JRockit VM中程序的执行性能会非常高效，但程序在启动时必然花费更长的事件来进行编译。对于服务端应用来说，启动时间并非是关注重点，但对于那些看中启动时间的应用场景而言，或许需要采用解释器与即时编译器并存的架构来换取一个平衡点。

在此模式下，当Java虚拟机启动时，解释器可以首先发挥作用，而不必等待即时编译器全部编译完成后再执行，这样可以省去许多不必要的编译时间。随着时间的推移，编译器发挥作用，把越来越多的代码编译成本地代码，获得更多的执行效率。

同时，解释执行在编译器进行激进优化不成立的时候，作为编译器的“逃生门”。

💥案例💥
注意解释器与编译器执行在线上环境微妙的辩证关系。机器在热机状态可以承受的负载要大于冷机状态。如果以热机状态时的流量进行切流，可能使处于冷机状态的服务器因无法承载流量而假死。
在生产环境发布过程中，以分批的方式进行发布，根据机器数量划分成多个批次，每个批次的机器数至多占到整个集群的1/8。曾经有这样的故障案例：某程序员在发布平台进行分批发布，在输入发布总匹数时，误填写成分两批发布，如果是热机状态，在正常情况下一半的机器可以勉强承载流量，但由于刚启动的JVM均是解释执行，还没有进行热点代码统计和JIT动态编译，导致机器启动后，当前1/2发布成功的服务器马上全部宕机，此故障说明了JIT的存在。—阿里团队

3.6.2 热点代码及探测方式

当判定是否需要启动JIT编译器将字节码直接编译为对应平台的本地机器指令，则需要根据代码被调用执行的频率而定。关于哪些需要被编译为本地代码的字节码，也被称之为“热点代码‘，JIT 编译器在运行时会针对哪些频繁被调用的”热点代码“做出优化，将其直接编译为对应平台的本地机器指令，以此提升Java程序的执行性能。

一个被多次调用的方法，或者是一个方法体内部循环次数较多的循环体都可以被称之为’热点代码”，因此都可以通过JIT编译器编译为本地机器指令。由于这种编译方式发生在方法的执行过程中，因此也被称之为栈上替换，或简称为OSR编译。
一个方法究竟要被调用多少次，或者一个循环体究竟需要执行多少次循环才可以达到这个标准？必然需要一个明确的阈值，JIT编译器才会将这些“热点代码”编译为本地机器指令执行。这里主要依靠热点探测功能。
目前HotSpot VM 所采用的热点探测方式是基于计数器的热点探测.
采用基于计数器的热点探测，HotSpot VM将会为每一个方法都建立2个不同类型的计数器，分别为方法的调用计数器和回边计数器
方法调用计数器用于统计方法的调用次数
回边计数器则用于统计循环体执行的循环次数

热度衰减

如果不做任何设置，方法调用计数器统计的并不是方法被调用的绝对次数，而是一个相对的执行频率，即一段时间之内被调用的次数。当超过一定的时间限度，如果方法的调用次数仍然不足以让它提交给即时编译器，那么这个方法的调用计数器就会减少一半，这个过程称为方法调用计数器热度的衰减，而这段时间就称为此方法统计的半衰周期。

进行热度衰减的动作是在虚拟机进行垃圾收集时顺便进行的，可以使用虚拟机参数-XX：UserCounterDecay 来关闭热度衰减，让方法计数器统计方法调用的绝对次数，这样，只要系统运行事件足够长，绝大部分方法都会被编译成本地代码。
另外可以使用-XX：CounterHalflifeTime参数设置半衰减周期的时间，单位是秒。

3.7 HotSpot VM 设置模式

默认情况下HotSpot VM是采用解释器与即时编译器并存的架构，当然开发人员可以根据具体的应用场景，通过命令显式地为Java虚拟机指定运行时到底是完全采用解释器执行，还是完全采用即时编译器执行，如下所示：

-Xint:完全采用解释器模式执行程序
-Xcomp:完全采用即时编译器模式执行程序，如果即时编译出现问题，解释器会介入执行。
-Mxied mode:采用解释器+即时编译器的混合模式共同执行程序。

C1编译器、C2编译器

在HotSpot VM 中内嵌有两个JIT编译器，分别为Client Compiler和Server Complier，但大多数情况下我们简称为C1编译器和C2编译器。开发人员可以通过如下命令显式指定Java虚拟机在运行时到底使用那一种即时编译器，如下所示：

Client：指定Java虚拟机运行在Client模式下，并使用C1编译器；
C1编译器会对字节码进行简单和可靠的优化，耗时短。以达到更快的编译速度。
Server:指定Java虚拟机运行在Server模式下，并使用C2编译器。
C2进行耗时较长的优化，以及激进优化，但优化的代码执行效率更高。

🌟🌟🌟好了到此，我们本篇就把对象实例化过程和即时编译器讲解完了，下篇我们就将对常量池做出特别的分析，记得关注点赞哦🌟🌟🌟

💥推荐阅读💥

上一篇：六、JVM从入门到精通之运行时数据区分析（篇三）

下一篇：八、JVM从入门到精通之常量池分析

猿小许

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
七、JVM从入门到精通之对象实例化过程

hello ,大家好，我是猿小许呀????????????！上一篇中我们将运行时数据区的方法区做了详细的讲解说明，接下来我们会分析对象的实例化过程做出详解，Are you ready????????????? go!一、对象的实例化1.1 创建对象的步骤1.1.1 判断对象对应的类是否加载、链接、初始化虚拟机遇到一条new 指令，首先去检查这个指令的参数能否在Metaspace的常量池中定位到一个类的符合引用，并且检查这个符号引用代表的类是否已经被加载、解析和初始化。（即判断类元信息是否存在
复制链接

扫一扫