一、jvm内存模型的剖析-CSDN博客

本文链接：https://blog.csdn.net/2301_77203215/article/details/134407100

一、内存模型概览

一般来将jvm的内存模型比较简单，如下图所示：

其中对重要的分为两个部分：

类装载系统
运行时数据区，也就是常说的内存模型

那么我们编写的一个helloworld.java文件如何成功运行的呢？这大体也分为两个部分，且这个两部分是重点知识：

javac 将java文件按照一定的逻辑规则编译成class文件。
因此这个块需要掌握class文件的格式，例如：cafebabe+version，静态常量池，method code：jvm指令等等。
java 将class文件加载到内存模型中【主要是方法区元空间】。
这块需要掌握类加载机制。classloader
双亲委派
如何打破双亲委派
spi

二、虚拟机栈

栈，又叫虚拟机栈，又可以叫线程栈。因为其与对应的线程相互依赖。

线程执行会开辟栈空间，当每个线程执行方法的时候，会在栈中开辟栈帧。

从上面的描述可以推论两个结论：

当线程很多的时候，会导致内存溢出。（因为内存不够了）。那么我们可以通过-Xss参数设置每个线程的栈大小。
当某个线程执行的方法很多的时候，会出现栈溢出（栈空间不够了StackOverflow）

那么栈帧中都包含什么呢？

局部变量表。存储当前方法中定义的变量（有可能是数，也有可能是地址）

需要注意的是，当我们执行User user = new User（）的时候，在栈帧的局部变量表中，并不会分配一个变量user，而是分配一块空间，这个空间存储的是 user对象在堆中的地址。但是jvm会知道当前的这块空间就是user变量来用的。
因此栈中的变量有可能指向了堆，这也说明了为什么栈的数据可以当做gcroot。

操作数栈。在方法中会进行操作运算，因此会有操作数栈来存储计算结果
动态链接。例如在main方法中调用add方法，那么在执行到add方法的时候，需要去解析add方法的具体code，在此之前main中仅仅记录了add的code的内存位置（方法区），只有当真正执行的时候，才会去通过内存地址找到对应的code。后续详细讲述
方法出口。
锁记录

三、本地方法栈

本地的native方法一般由c++实现。而本地方法和java的方法一样，都需要一个栈来存储方法的栈帧。

四、堆空间

老生常谈的分代模型

堆空间的设置参数为 -Xms -Xmx -Xmn

-Xms 堆初始空间
-Xmx 堆最大空间
-Xmn 年轻代空间
-XX:MetaspaceSize。元空间初始容量
-XX:MaxMetaspaceSize。元空间最大容量

为什么要设置元空间的大小呢？默认元空间为21M，当达到这个值的时候，居然会触发fullgc，并且自动调整metaspacesize的大小。这代价太大了，因此我们一般将元空间的大小固定下来，也就是说将MetaspaceSize=MaxMetaspaceSize=256M。

整个堆空间分为年轻代+老年代，比例为1:2。在年轻代中又分为eden+s1+s2，比例为8:1:1。

针对分代模型，不同的垃圾回收器所采用的回收算法大体一致

年轻代===》采用标记复制算法

老年代===》标记整理算法

下面我们模拟一下传统gc的流程：

不断向eden添加对象
当eden满了，进行gc，将存活的对象copy至s1
但是eden区的空间比s1，因此s1肯定容不下那么多数据，因此ygc的时候，会向old区担保，此时s1有一部分数据，old区有一部分数据。同时将eden区清空
不断添加，eden区又满了，将eden区数据和s1的数据copy至s0，同理s0也容不下，也需要担保，此时s0一部分数据，old区又增加了一部分
不断重复，最终old满了，触发fullgc。fullgc对老年代进行标记整理，但是没有空间，最终outofmemory

不论是ygc和fullgc都需要stop the world。那么为什么gc都需要stw呢？可不可以不stw？

答案是不可以，因为不stw的话，线程一直执行，那么被标记的非垃圾对象，有可能线程结束了，变成了垃圾对象了，这就导致没有清理干净，这就是所谓的浮动垃圾。那gc不就白做了吗。虽然cms垃圾器在一定程度上减少了stw，但是在初始标记和重标记的时候，依然需要stw。