一、JVM体系结构概述
1.JVM的位置
JVM是运行在操作系统之上的,它与硬件没有直接的交互
2.类加载器ClassLoader
负责加载class文件,class文件在文件开头有特定的文件标示,并且ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定。
加载器分为启动类加载器,扩展类加载器,应用程序类加载器和用户自定义类加载器:
- 启动类加载器(Bootstrap)C++
- 扩展类加载器(Extension)Java
- 应用程序类加载器(AppClassLoader)Java
也叫系统类加载器,加载当前应用的classpath的所有类 - 用户自定义加载器
java.lang.ClassLoader的子类,用户可以定制类的加载方式
3.沙箱机制和双亲委派机制
双亲委派机制
双亲委派模型:如果一个类加载器收到了类加载的请求,他首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,因此所有的加载请求最终都会传到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求时,自家在其才会尝试自己去加载。
比如用户自定义一个类,他会先从应用程序类加载器开始,向上委派到扩展类加载器,再向上委派到启动类加载器,此时启动类加载器无法加载此类,向下反馈无法加载请求到扩展类加载器,扩展类加载器同理向下反馈到应用程序类加载器,最后通过应用程序类加载器加载此请求。
但是,如果自己写了一个java.lang.String的类,经实验却还是用到了系统自带的String类,这就用到了下面的这一个机制:沙箱机制
沙箱机制
沙箱机制是由基于双亲委派机制上,采取的一种JVM的自我保护机制,如上,自定义一个java.lang.String类,由于双亲委派机制的原理,此请求会先交给Bootstrap试图进行加载,但是Bootstrap在加载类时首先通过包和类名查找rt.jar中有没有该类,有则优先加载rt.jar包中的类,因此就保证了java的运行机制不会被破坏。所以自定义的String类不会被运行。
二、JVM内存模型
1.Execution Engine
Execution Engine执行引擎负责解释命令,提交操作系统执行。
2.Native Interface本地接口
它的具体做法是 Native Method Stack中登记 native方法,在Execution Engine 执行时加载native libraies(本地方法库)。
3.Native Method Stack
它的具体做法是Native Method Stack 中登记native方法,在Execution Engine执行时加载本地方法库。
4.PC寄存器
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向下一条指令的地址,也即将要执行的指令代码),由执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不记。
5.Method Area 方法区
- 方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法如构造函数,接口代码也在此定义。简单说,所有定义的方法的信息都保存在该区域,此区属于共享区间。
- 静态变量、常量、类信息(构造方法/接口定义)和运行时常量池都存在于方法区中。
- 在JDK1.7之前,HotSpot使用永久代实现方法区。1.8之后,由元空间实现。
- 注意:实例变量存在堆内存中,和方法区无关。
6.栈
6.1、什么是栈?
- 栈也叫栈内存,主管Java程序的运行,是在线程创建时创建,它的生命期是跟随线程的生命期,线程结束栈内存也就释放,对于栈来说不存在垃圾回收问题,只要线程一结束该栈就结束,生命周期和线程一致,是线程私有的。
- 一个线程中的每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。8种基本类型的变量+对象的引用变量+实例方法都是在函数的栈内存中分配。
- 在栈区域规定了两种异常状态:如果线程请求的栈深度大于虚拟机所允许的深度,则抛出StackOverflowError异常;如果虚拟机栈可以动态扩展,在扩展是无法申请到足够的内存,就会抛出OutOfMemoryError异常。
6.2、栈帧
一个线程的每个方法在调用时都会在栈上划分一块区域,用于存储方法所需要的变量等信息,这块区域称之为栈帧(stack frame)。栈由多个栈帧构成,好比一部电影由多个帧的画面构成。
6.3、运行原理
- 栈中的数据都是以栈帧(Stack Frame)为载体存在。在栈中,方法的调用顺序遵循“先进后出”/“后进先出”原则。
- 当一个方法A被调用时就产生了一个栈帧 F1,并被压入到栈中,A方法又调用了 B方法,于是产生栈帧 F2 也被压入栈,B方法又调用了 C方法,于是产生栈帧 F3 也被压入栈,……
- 执行完毕后,先弹出F3栈帧,再弹出F2栈帧,再弹出F1栈帧……
- 每执行一个方法都会产生一个栈帧,保存到栈(后进先出)的顶部,顶部栈就是当前的方法,该方法执行完毕后会自动将此栈帧出栈。
栈帧中主要保存3种数据:
- 本地变量(Local Variables):输入参数和输出参数以及方法内的变量
- 栈操作(Operand Stack):记录出栈、入栈的操作;
- 栈帧数据(Frame Data):包括类文件、方法等等。
7.堆
7.1、逻辑设计
堆内存分为三部分:新生区、养老区和永久区(JDK1.8后为元空间),其中新生区分为伊甸区、幸存者0区和幸存者1区。
7.2、物理设计
- 新生区分为eden区、s0区、s1区,s0和s1也被称为from和to区域,他们是两块大小相等并且可以互相角色的空间。绝大多数情况下,对象首先分配在eden区,在新生区回收后,如果对象还存活,则进入s0或s1区,之后每经过一次新生代回收,如果对象存活则它的年龄就加1,对象达到一定的年龄(默认15)后,则进入老年代。
- 当伊甸区的空间用完时,程序又需要创建对象,JVM的垃圾回收器将对伊甸区进行垃圾回收(Minor GC),将伊甸区中的不再被其他对象所引用的对象进行销毁。然后将伊甸区中的剩余对象移动到幸存 0区。若幸存 0区也满了,再对该区进行垃圾回收,然后移动到 1 区。那如果1 区也满了呢?再次垃圾回收,满足条件后再移动到养老区。若养老区也满了,那么这个时候将产生MajorGC(FullGC),进行养老区的内存清理。若养老区执行了Full GC之后发现依然无法进行对象的保存,就会产生OOM异常“OutOfMemoryError”。
- 永久存储区是一个常驻内存区域,用于存放JDK自身所携带的 Class,Interface 的元数据,也就是说它存储的是运行环境必须的类信息,被装载进此区域的数据是不会被垃圾回收器回收掉的,关闭 JVM 才会释放此区域所占用的内存
- Jdk1.6及之前: 有永久区, 常量池1.6在方法区
Jdk1.7: 有永久区,但已经逐步“去永久区”,常量池1.7在堆
Jdk1.8及之后: 无永久区,常量池1.8在元空间
7.3、OOM
- 如果出现java.lang.OutOfMemoryError: Java heap space异常,说明Java虚拟机的堆内存不够。
(1)Java虚拟机的堆内存设置不够,可以通过参数-Xms、-Xmx来调整。
(2)代码中创建了大量大对象,并且长时间不能被垃圾收集器收集(存在被引用)。 - 如果出现java.lang.OutOfMemoryError: PermGen space异常,说明是Java虚拟机对永久代Perm内存设置不够。
一般出现这种情况,都是程序启动需要加载大量的第三方jar包。例如:在一个Tomcat下部署了太多的应用。或者大量动态反射生成的类不断被加载,最终导致Perm区被占满。
7.4、体系结构图
三、堆参数调优
1.常见参数及其设置
VM初始分配的堆内存由-Xms指定,默认是物理内存的1/64;JVM最大分配的堆内存由-Xmx指定,默认是物理内存的1/4。默认空余堆内存小于40%时,
JVM就会增大堆直到-Xmx的最大限制;空余堆内存大于70%时,JVM会减少堆直到-Xms的最小限制。因此服务器一般设置-Xms、-Xmx 相等以避免在
每次GC 后调整堆的大小。
参数名及含义
-Xms:堆初始值(默认为物理内存的1/64)
-Xmx:堆最大可用值(默认为物理内存的1/4)
-XX:+PrintGC:每次触发GC的时候打印相关日志
-XX:+UseSerialGC:串行回收
-XX:+PrintGCDetails:更详细的GC日志
-Xmn:新生代堆初始值
-XX:SurvivorRatio:用来设置新生代中eden空间和from/to空间的比例,默认为8
-XX:NewRatio:配置新生代与老年代占比,默认1:2
-Xss:每个线程的堆栈大小,默认为1M,此值不能设置过大,否则会减少线程并发数。
2.两个异常
- OutOfMemoryError
- 错误原因: java.lang.OutOfMemoryError: Java heap space 堆内存溢出
- 解决办法:调大堆内存大小
- StackOverflowError
- 错误原因: java.lang.StackOverflowError表示为栈内存溢出,一般产生于递归调用。
- 解决办法:设置线程最大调用深度(-Xss5m 设置最大调用深度)