目录
一、内存模型概览
一般来将jvm的内存模型比较简单,如下图所示:
其中对重要的分为两个部分:
- 类装载系统
- 运行时数据区,也就是常说的内存模型
那么我们编写的一个helloworld.java文件如何成功运行的呢?这大体也分为两个部分,且这个两部分是重点知识:
- javac 将java文件按照一定的逻辑规则编译成class文件。
- 因此这个块需要掌握class文件的格式,例如:cafebabe+version,静态常量池,method code:jvm指令等等。
- java 将class文件加载到内存模型中【主要是方法区元空间】。
- 这块需要掌握类加载机制。classloader
- 双亲委派
- 如何打破双亲委派
- spi
二、虚拟机栈
栈,又叫虚拟机栈,又可以叫线程栈。因为其与对应的线程相互依赖。
线程执行会开辟栈空间,当每个线程执行方法的时候,会在栈中开辟栈帧。
从上面的描述可以推论两个结论:
- 当线程很多的时候,会导致内存溢出。(因为内存不够了)。那么我们可以通过-Xss参数设置每个线程的栈大小。
- 当某个线程执行的方法很多的时候,会出现栈溢出(栈空间不够了StackOverflow)
那么栈帧中都包含什么呢?
- 局部变量表。存储当前方法中定义的变量(有可能是数,也有可能是地址)
- 需要注意的是,当我们执行User user = new User()的时候,在栈帧的局部变量表中,并不会分配一个变量user,而是分配一块空间,这个空间存储的是 user对象在堆中的地址。但是jvm会知道当前的这块空间就是user变量来用的。
- 因此栈中的变量有可能指向了堆,这也说明了为什么栈的数据可以当做gcroot。
- 操作数栈。在方法中会进行操作运算,因此会有操作数栈来存储计算结果
- 动态链接。例如在main方法中调用add方法,那么在执行到add方法的时候,需要去解析add方法的具体code,在此之前main中仅仅记录了add的code的内存位置(方法区),只有当真正执行的时候,才会去通过内存地址找到对应的code。 后续详细讲述
- 方法出口。
- 锁记录
三、本地方法栈
本地的native方法一般由c++实现。而本地方法和java的方法一样,都需要一个栈来存储方法的栈帧。
四、堆空间
老生常谈的分代模型
堆空间的设置参数为 -Xms -Xmx -Xmn
- -Xms 堆初始空间
- -Xmx 堆最大空间
- -Xmn 年轻代空间
- -XX:MetaspaceSize。元空间初始容量
- -XX:MaxMetaspaceSize。元空间最大容量
为什么要设置元空间的大小呢?默认元空间为21M,当达到这个值的时候,居然会触发fullgc,并且自动调整metaspacesize的大小。这代价太大了,因此我们一般将元空间的大小固定下来,也就是说将MetaspaceSize=MaxMetaspaceSize=256M。
整个堆空间分为 年轻代+老年代,比例为1:2。 在年轻代中又分为eden+s1+s2,比例为8:1:1。
针对分代模型,不同的垃圾回收器所采用的回收算法大体一致
年轻代===》采用标记复制算法
老年代===》标记整理算法
下面我们模拟一下传统gc的流程:
- 不断向eden添加对象
- 当eden满了,进行gc,将存活的对象copy至s1
- 但是eden区的空间比s1,因此s1肯定容不下那么多数据,因此ygc的时候,会向old区担保,此时s1有一部分数据,old区有一部分数据。同时将eden区清空
- 不断添加,eden区又满了,将eden区数据和s1的数据copy至s0,同理s0也容不下,也需要担保,此时s0一部分数据,old区又增加了一部分
- 不断重复,最终old满了,触发fullgc。fullgc对老年代进行标记整理,但是没有空间,最终outofmemory
不论是ygc和fullgc都需要stop the world。 那么为什么gc都需要stw呢?可不可以不stw?
答案是不可以,因为不stw的话,线程一直执行 ,那么被标记的非垃圾对象,有可能线程结束了,变成了垃圾对象了,这就导致没有清理干净,这就是所谓的浮动垃圾。那gc不就白做了吗。虽然cms垃圾器在一定程度上减少了stw,但是在初始标记和重标记的时候,依然需要stw。