JAVA 虚拟机----JVM

最新推荐文章于 2024-10-05 12:07:50 发布

Asial Jim

最新推荐文章于 2024-10-05 12:07:50 发布

阅读量239

点赞数

文章标签： java jvm python

本文链接：https://blog.csdn.net/asialjim/article/details/85088315

版权

JVM

Java虚拟机，是一种计算机规范，用于运行Java代码的，在物理机上模拟计算机功能的虚拟计算机。

Java 通过JVM 达到一次编译到处运行的目的。Java的开发人员并需要关注各个计算机硬件平台的硬件环境，而是直接遵行Java的编码规范即可开发出具有各种实际功能的Java程序。经过编译的Java程序可以在任意一台安装了JVM虚拟机的平台上运行。从而实现Java的跨平台性。

JVM 支持的数据类型：

1）基础数据类型

byte（1个字节）、short（2个字节）、int（4个字节）、long（8个字节）、float（4个字节）、double（8个字节）、char（2个字节）、boolean（1位）。

2）引用数据类型

object 对一个Javaobject（对象）的4字节引用，基础引用空间大小4个字节，对象内部的属性根据其数据类型占用相应的内存空间，如：public class person { private int age ; private byte level} 对象的引用空间4个字节， int age 属性占用4个字节，byte level 占用1个字节，总共占用9字节，jvm在创建对象的时候，会根据对象实际需要的内存大小，分配最小的大于实际需要内存的8的倍数的内存空间，此处则为16字节的内存空间。

returnAddress 4字节，用于Java指令的方法返回值引用空间地址的存储。

JVM 运行时内存的划分：

Java程序具体执行的过程：

如上图所示，首先Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀)，然后由JVM中的类加载器加载各个类的字节码文件，加载完毕之后，交由JVM执行引擎执行。在整个程序执行过程中，JVM会用一段空间来存储程序执行期间需要用到的数据和相关信息，这段空间一般被称作为Runtime Data Area（运行时数据区），也就是我们常说的JVM内存。因此，在Java中我们常常说到的内存管理就是针对这段空间进行管理（如何分配和回收内存空间）。

在知道了JVM内存是什么东西之后，下面我们就来讨论一下这段空间具体是如何划分区域的，是不是也像C语言中一样也存在栈和堆呢？

Java 的jvm运行时内存的划分：

根据《Java虚拟机规范》的规定，运行时数据区通常包括这几个部分：程序计数器(Program Counter Register)、Java栈(VM Stack)、本地方法栈(Native Method Stack)、方法区(Method Area)、堆(Heap)。

程序计数器

　　程序计数器（Program Counter Register），也有称作为PC寄存器。逻辑上和C语言的寄存器功能类似，它保存的是程序当前执行的指令的地址（也可以说保存下一条指令的所在存储单元的地址），当JVM需要执行指令时，需要从程序计数器中得到当前需要执行的指令所在存储单元的地址，然后根据得到的地址获取到指令，在得到指令之后，程序计数器便自动加1或者根据转移指针得到下一条指令的地址，如此循环，直至执行完所有的指令。

　　由于在JVM中，多线程是通过线程轮流切换来获得CPU执行时间的，因此，在任一具体时刻，一个CPU的内核只会执行一条线程中的指令，因此，为了能够使得每个线程都在线程切换后能够恢复在切换之前的程序执行位置，每个线程都需要有自己独立的程序计数器，并且不能互相被干扰，否则就会影响到程序的正常执行次序。因此，可以这么说，程序计数器是每个线程所私有的。

　　在JVM规范中规定，如果线程执行的是非native方法，则程序计数器中保存的是当前需要执行的指令的地址；如果线程执行的是native方法，则程序计数器中的值是undefined。

　　由于程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变，因此，对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。

Java栈

　　Java栈也称作虚拟机栈（Java Vitual Machine Stack），也就是我们常常所说的栈，Java栈是Java方法执行的内存模型。

　　Java栈中存放的是一个个的栈帧，每个栈帧对应一个被调用的方法，在栈帧中包括局部变量表(Local Variables)、操作数栈(Operand Stack)、指向当前方法所属的类的运行时常量池（运行时常量池的概念在方法区部分会谈到）的引用(Reference to runtime constant pool)、方法返回地址(Return Address)和一些额外的附加信息。当线程执行一个方法时，就会随之创建一个对应的栈帧，并将建立的栈帧压栈。当方法执行完毕之后，便会将栈帧出栈。因此可知，线程当前执行的方法所对应的栈帧必定位于Java栈的顶部。所以，当Java程序员在实现递归的时候，一定要设定递归的推出条件，否则将会出现栈内存溢出异常。

　　局部变量表，顾名思义，想必不用解释大家应该明白它的作用了吧。就是用来存储方法中的局部变量（包括在方法中声明的非静态变量以及函数形参）。对于基本数据类型的变量，则直接存储它的值，对于引用类型的变量，则存的是指向对象的引用。局部变量表的大小在编译器就可以确定其大小了，因此在程序执行期间局部变量表的大小是不会改变的。

　　操作数栈，想必学过数据结构中的栈的朋友想必对表达式求值问题不会陌生，栈最典型的一个应用就是用来对表达式求值。想想一个线程执行方法的过程中，实际上就是不断执行语句的过程，而归根到底就是进行计算的过程。因此可以这么说，程序中的所有计算过程都是在借助于操作数栈来完成的。

　　指向运行时常量池的引用，因为在方法执行的过程中有可能需要用到类中的常量，所以必须要有一个引用指向运行时常量。

　　方法返回地址，当一个方法执行完毕之后，要返回之前调用它的地方，因此在栈帧中必须保存一个方法返回地址。

　　由于每个线程正在执行的方法可能不同，因此每个线程都会有一个自己的Java栈，互不干扰。

本地方法栈

　　本地方法栈与Java栈的作用和原理非常相似。区别只不过是Java栈是为执行Java方法服务的，而本地方法栈则是为执行本地方法（Native Method）服务的。在JVM规范中，并没有对本地方发展的具体实现方法以及数据结构作强制规定，虚拟机可以自由实现它。在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一。

堆

　　Java中的堆是用来存储对象本身的以及数组本身（对象、数组的引用是存放在Java栈中的）。在Java中，程序员基本不用去关心空间释放的问题，Java的垃圾回收机制会自动进行处理。因此这部分空间也是Java垃圾收集器管理的主要区域。另外，堆是被所有线程共享的，在JVM中只有一个堆。

方法区

　　方法区在JVM中也是一个非常重要的区域，它与堆一样，是被线程共享的区域。在方法区中，存储了每个类的信息（包括类名、方法信息、字段信息）、静态变量、常量以及编译器编译后代码等。

　　在Class文件中除了类的字段、方法、接口等描述信息外，还有一项信息是常量池，用来存储编译期间生成的字面量和符号引用。

　　在方法区中有一个非常重要的部分就是运行时常量池，它是每一个类或接口的常量池的运行时表示形式，在类和接口被加载到JVM后，对应的运行时常量池就被创建出来。当然并非Class文件常量池中的内容才能进入运行时常量池，在运行期间也可将新的常量放入运行时常量池中，比如String的intern方法。

　　在JVM规范中，没有强制要求方法区必须实现垃圾回收。很多人习惯将方法区称为“永久代”，是因为HotSpot虚拟机以永久代来实现方法区，从而JVM的垃圾收集器可以像管理堆区一样管理这部分区域，从而不需要专门为这部分设计垃圾回收机制。不过自从JDK7之后，Hotspot虚拟机便将运行时常量池从永久代移除了。

堆内存的划分

jvm为了实现对内存的管理以及实现动态垃圾回收机制（不需要程序员手动实现Java的垃圾回收，而是将垃圾回收工作交给jvm虚拟机系统），将堆内存划分为新生代和长久代，其中新生代又划分为Eden区和两个Survivor区。

在Eden区中，存放的是新new出来的对象，而在这个对象中，98%的对象都是朝生夕死，活不到下一次垃圾回收的时候。而两个Survivor中存放的是在垃圾回收时还能够存活的对象。而至于为什么要分配两个survivor区跟jvm的垃圾GC机制有关。在新生代中，jvm的GC 算法是复制清除算法。在垃圾回收的时候，将Eden 区的还存活的对象复制到Survivor中，并清除整个Eden区，同时也将另外一个Survivor中的存活的对象也复制到这个Survivor区中，并清除另外一个Survivor 区。

如何判断对象是否可以回收或存活

判断对象是否存活或者可回收(引用计数法, Root 可达性分析法)

引用计数法：当一个对象被引用的时候，这个对象的计数器就+1，当引用失效的时候，计数器就-1，当该对象的计数器值为0 的时候，就表示该对象没有被实际引用，可以被回收。但是这种分析方法有一个缺陷，当程序中出现对象的嵌套来回引用时，此分析方法就失去作用，无法分析。为此，root 可达性分析方法出现。

Root 可达性分析：

此方法的基本思路为从名为GC Root 对象开始，向下分析搜索，其搜索过的路径为引用链，当一个对象没有任何引用链的时候，则表明该对象是不可用的，也就是说这个对象是可以被垃圾回收器回收的。

可作为GC Roots对象的包括如下几种：
    > a.虚拟机栈(栈桢中的本地变量表)中的引用的对象
    > b.方法区中的类静态属性引用的对象
    > c.方法区中的常量引用的对象
    > d.本地方法栈中JNI的引用的对象

常见的GC回收算法及其含义

标记-清除算法：
   标记阶段：先通过根节点，标记所有从根节点开始的可达对象。因此，未被标记的对象就是未被引用的垃圾对象；
   清除阶段：清除所有未被标记的对象。
   缺点：标记和清除过程效率不高，标记清除之后会产生大量不连续的内存碎片。
复制算法：（新生代的GC）
将原有的内存空间分为两块，每次只使用其中一块，在垃圾回收时，将正在使用的内存中的存活对象复制到未使用的内存块中，然后清除正在使用的内存块中的所有对象。
   缺点：内存缩小为原来的一半。
标记-整理算法：（老年代的GC）
   标记阶段：先通过根节点，标记所有从根节点开始的可达对象。因此，未被标记的对象就是未被引用的垃圾对象
   整理阶段：将将所有的存活对象压缩到内存的一端；之后，清理边界外所有的空间
   缺点：在标记-清除的基础上还需进行对象的移动，成本相对较高，好处则是不会产生内存碎片。
分代收集算法：
   存活率低：少量对象存活，适合复制算法：在新生代中，每次GC时都发现有大批对象死去，只有少量存活（新生代中98%的对象都是“朝生夕死”），那就选用复制算法，只需要付出少量存活对象的复制成本就可以完成GC。
   存活率高：大量对象存活，适合用标记-清理/标记-整理：在老年代中，因为对象存活率高、没有额外空间对他进行分配担保，就必须使用“标记-清理”/“标记-整理”算法进行GC。

类加载的过程：加载、验证、准备、解析、初始化

什么情况下会触发类加载；
    > 创建类的实例
    > 访问类的静态变量(除常量【被final修辞的静态变量】原因:常量一种特殊的变量，因为编译器把他们当作值(value)而不是域(field)来对待。如果你的代码中用到了常变量(constant variable)，编译器并不会生成字节码来从对象中载入域的值，而是直接把这个值插入到字节码中。这是一种很有用的优化，但是如果你需要改变final域的值那么每一块用到那个域的代码都需要重新编译。
    > 访问类的静态方法
    > 反射如(Class.forName("my.xyz.Test"))
    > 当初始化一个类时，发现其父类还未初始化，则先出发父类的初始化
    > 虚拟机启动时，定义了main()方法的那个类先初始化