JVM总结（一）

最新推荐文章于 2024-07-18 16:57:41 发布

gyt_b

最新推荐文章于 2024-07-18 16:57:41 发布

阅读量164

点赞数

本文链接：https://blog.csdn.net/gyt_b/article/details/107290064

版权

jvm是运行在用户空间的虚拟计算机，是一种跨语言的平台；任何符合jvm规范的class文件都可以在平台上运行，与是否是java语言无关。以下主要从java语言的角度总结。

JVM基础知识

JVM/JRE/JDK

jvm ，java的运行平台
jre，jvm + core lib，是java语言的运行环境
jdk，jre + development kit，java的开发工具

常见的JVM

常见的jvm有oracle官方的Hotspot，BEA的Jrockit，现已被oracle收购，现在的Hotspot是原Hotspot与Jrockit的组合版；还有IBM的J9，微软的Microsoft VM，Hotspot的深度定制版TaobaoVM等。

Java的执行过程

在这里插入图片描述
类加载器class Loader 有两种模式，字节码解释器，JTL即时编译器。

class 的生命周期（class cycle）

jvm中一个class 通过了 loading --> linking --> initializing -->gc 的过程完成了一次生命周期。
而linking中又分为三步Verification Preparation Resolution。

loading

class文件被class loader 加载到内存以后，class的对象，指向class类的文件。

类加载器的种类

BootStrap,是引导类加载器，加载核心类，是用c++实现的，通过xxx.class.getClassLoader()返回的是null。
Extension，是扩展类加载器，加载扩展jar包。
App，是系统类加载器，加载classpath指定的内容。

CustomClassLoader，自定义的类加载器，由client自定义classloader。

 类加载器自1-4不是继承关系，自上而下是父加载器，不是类加载器的加载器，也不是类加载器的父加载器。

类加载机制（双亲委派机制）

加载过程：
为什么使用双亲委派机制？
主要是出于安全考虑的，避免核心的API被篡改，也可以避免类的重复加载。
classLoader代码执行过程
加载类时调用loadclass方法，先查询cache，若加载过就不会再重新加载，是在此方法中实现的双亲委派机制，要打破双亲委派机制，需重写loadclass方法，在jdk1.2之前，还有tomact热启动/热部署中，双亲委派机制被打破过。
查询cache中未返回结果，再执行findClass方法，在class list中查找并加载。若要自定义classLoader，只需要extends ClassLoader，然后重写findclass方法即可，这是采用模板方法的设计模式实现的。
执行模式

执行模式	参数设置	说明
混合模式	-Xmixed	开始时时解释执行，启动很快，热点代码实行检测和编译
解释器模式	-Xint	启动快，执行稍慢
纯编译模式	-XComp	启动慢，执行快

热点代码是指，多次被调用的方法，多次被调用的循环，检测热带你代码的方法，

-XX:CompileThreshold = 10000

linking

Verification
校验文件是否符合jvm规范
Preparation
class文件的静态成员变量赋值为默认值
Resolution
解析，将类/方法/属性等符号引用解析为直接引用

initializing

静态成员变量赋值为初始值。

小结

对象的创建过程：
在这里插入图片描述

JMM（java内存模型）

java内存模型的全称时java memory model。

硬件层数据一致性

英特尔（intel）采用缓存一致性协议（MESI），数据一致性是通过缓存锁和总线锁来实现的。

缓存锁

读取缓存的基本单位是缓存行（cache line），经过工业实验，cache line的一般是64字节（bytes）。若同一缓存行的两个不同数据被不同的CPU锁定是，改变其中任何一个都要触发另外一个同步，会降低效率，这种现象被称为伪共享；要提高伪共享的效率，可在数据前后添加long型的变量实现对齐，称为缓存行对齐。例如：disrupt就采用了这种方式。

总线锁

对于某些无法缓存的数据，或者跨越多个缓存行的数据，不能用缓存锁，需要用总线锁来实现数据的一致性。

乱序问题

乱序问题是cpu为了提高执行效率采取的一种策略，不是真正意义上的乱序。

读乱序
CPU的速度至少比内存快100倍，为了提升效率，会打乱原来的执行效率，会在一条指令执行过程中（比如去内存读数据，大概慢100多倍），去同时执行另一条指令，前提是两条指令没有依赖关系（洗茶壶/烧水-茶叶入壶-煮茶-喝茶）。洗茶壶/烧水两个步骤就没有依赖关系，可以同时进行。
写合并
WC Buffer（Write Combining Buffer）一般是4个字节，比L1缓存快，由于ALU速度太快，为了提高写效率，CPU在写入L1时，写入一个WC Buffer，当WC Buffer满了之后，直接用WC写入L2。
有序性保障

3.1 X86 CPU级别
cpu级别是通过内存屏障和原子指令来保障有序性。

3.1.1 不同类型的cpu，内存屏障的实现不同，intel cpu比较简单，有以下3种：
3.1.1.1 sfence，写屏障指令，也就是save fence。在sfence指令前的写操作必须在sfence指令后的写操作前完成，即屏障两端的写操作不乱序。
3.1.1.2 lfence，读屏障指令，也就是load fence。在lfence指令前的读操作必须在lfence指令后的读操作前完成，即屏障俩高端的读操作不乱序。
3.1.1.3 mfence，读写屏障，在mfence指令前得读写操作必须在mfence指令后的读写操作前完成，屏障前后的读写操作不乱序。
3.1.2 原子指令，lock，执行lock指令时会锁住内存子系统，来确保执行顺序

3.2 JVM级别规范
3.2.1 jvm级别的内存屏障有以下4种：
LoadLoad，StoreStore，LoadStore，StoreLoad；例如：load1 LoadLoad load2,load2及后续的读操作要读取的数据被访问之前需要确保已经被load1读取完毕。
3.2.2 jvm指令的重排序需要遵守8条规则，即happens-before原则。但是，无论怎么重排序，最后的执行结果是不变的（as is serial）。
3.2.3 volatile 实现细节
① 字节码层面
加了ACC_VOLATILE的标志
② JVM层面
对volatile内存区的读写都加了内存屏障
```
 	StoreStoreBarrier
 	volatile写操作
 	StoreLoadBarrie
 	
 	LoadLoadBarrier
 	volatile读操作
 	LoadStoreBarrier
```
③ OS和硬件层面
用windows的lock指令实现
3.2.4 synchronized 实现细节
① 字节码层面
synchronized void m(){} 添加 ACC_SYNCHRONIZED 标记
void n(){synchronized(this){}} 用monitorenter monitorexit实现
② JVM层面
C C++ 调用了操作系统提供的同步机制
③ OS和硬件层面

lock compxch /xxx #lock 后面执行的内存修改，其他CPU无法操作

对象在内存中的存储布局

在这里插入图片描述

mark word 的分布如下图：

由图可以得知：分代年龄最大位15；对象在无锁状态时的hashcode位原始hashcode，被重写过后，原始hashcode将不会再存在。
Class Pointer
指向class文件的指针

	-XX:+UseCompressedClassPointers 	#开启压缩（默认），4字节
    -XX:-UseCompressedClassPointers 		#不开启压缩，8字节

实例数据（instance data)，其中数组长度占4字节，普通对象中，指向普通对象的指针Oops（Ordinary Object Pointers），在开启压缩的情况下占4字节，不开启占8字节，设置参数为-XX:+UseCompressedOops。
Padding对齐，对象的总长度与8的倍数对齐，若是8的倍数，则没有Padding，若不是8的倍数，用Padding补齐。
Hotspot 开启内存压缩的规则

内存大小	压缩规则
<4G	直接砍掉高32位
4G-32G	默认开启内存压缩Oops
>4G	压缩无效，直接使用64位

由此可见，内存不是越大越好。
6. 对象定位（访问对象的方式）

句柄池，java堆区划分一块内存作为句柄池，对象被移动时，只会改变句柄中实例数据的指针，比较稳定。
直接指针，速度快，节省了一次指针定位的时间开销，Hotspot采用此种方式访问对象。
具体描述可参照句柄池/直接指针详细介绍

运行时数据区和指令集

运行时数据区（JavaRuntime Data Area）

线程共享区域随VM启动存在，线程私有区域随线程启动存在

程序计数器，存放指令位置，在VM运行的过程中，循环执行取指令/执行指令，计数器++的操作（取出PC中的位置，然后找到对应位置的指令，执行，执行完之后PC++）。
jvm stack，每个方法在执行的同时都会创建一个栈帧（Frame），存储本地变量表（Local Variable Table)，操作数栈(Operand Stack)，动态链接（Dynamic Liniking），方法出口（return address）等信息。
本地变量表相当于jvm中的寄存器，存放基本数据类型，boolean/byte/char/short/int/float/long/double/对象引用，long和double是64位的，占用2个本地变量表空间，其余类型的占用一个；对于static method(){},存放的是参数和变量等信息，对于非static方法，第0个位置是this，第一个开始是参数/变量等信息。
操作数栈，是在方法执行过程中的压栈（load）/弹栈（store）操作。
动态链接，寻找常量池中找到真的value（class文件格式）
方法出口，例如：A方法调用了B方法，B方法返回值就在方法出口中。
本地方法栈，与vm栈相似，vm栈是位java方法服务的，native method stack 是为本地方法服务的。
堆，又称为GC堆，是垃圾回收器管理的主要区域，存放的是java对象实例，在GC中详细讲解。
方法区，主要存放的是jvm加载的类信息，常量，静态变量，即时编译器编译后的代码等数据。在jdk1.8之前，方法区又称为Permanent Space（永久代），字符串常量位于Permanent Space，FGC不会被清理，大小在启动的时候已经被指定，不能改变；在jdk1.8之后，被称为Meta Space（元数据区），字符串常量位于Heap，会触发FGC清理，若不设定大小，最大是物理内存。

指令集（InstructionSet）

指令集分为基于寄存器的指令集，和基于栈的指令集，Hospot是基于栈的指令集。
常用的指令有，store（弹栈），load（压栈），mul（乘法），sub（减法）；invoke_xxx（方法调用），如InvokeStatic（调用静态方法），InvokeSpecial（调用private方法），InvokeInterface（调用接口）。