JVM = 类加载器(classloader) + 执行引擎(execution engine) + 运行时数据区域(runtime data area)
运行时数据区域
JVM内存中的运行时数据区分为:方法区,虚拟机栈,堆,本地方法栈,程序计数器5大部分
其中JAVA堆和方法区是线程共享的内存,java虚拟机栈,程序计数器,本地方法栈是各个线程私有的内存区域。
程序计数器(Program Counter Register)
- 线程私有,它的生命周期与线程相同。
- 可以看做是当前线程所执行的字节码的行号指示器。
- 在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,如:分支、循环、跳转、异常处理、线程恢复(多线程切换)等基础功能。
- 如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Natvie方法,这个计数器值则为空(undefined)。
- 程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变,所以此区域不会出现OutOfMemoryError的情况。
程序计数器主要为字节码解释器来服务,通过改变字节码解释器的计数器值来选取下一条需要执行的字节码指令
Java虚拟机栈(JVM Stacks)
- 线程私有的,它的生命周期与线程相同。
- 虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(Stack Frame)用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
- 局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型),它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)和returnAddress类型(指向了一条字节码指令的地址)。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
- 该区域可能抛出以下异常:
- 当线程请求的栈深度超过最大值,会抛出 StackOverflowError 异常;
- 栈进行动态扩展时如果无法申请到足够内存,会抛出 OutOfMemoryError 异常
虚拟机栈是线程私有的,主要是为了虚拟机在执行方法时提供支持,其中方法执行时会创建出一个栈帧来保存局部变量表,操作栈,动态链接等信息,方法的执行过程就对应着一个在栈中入栈出栈的过程。在这个过程中如果出现对栈的调用深度过深就会出现StackOverFlowError异常,如果在栈内存动态扩展过程中内存不足会导致,OOM异常。
本地方法栈(Native Method Stacks)
- 与虚拟机栈非常相似,其区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的Native 方法服务。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(譬如Sun HotSpot 虚拟机)直接就把本地方法栈和虚拟机栈合二为一。
- 与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。
本地方法栈顾名思义也就是给Native方法服务的,遇到本地内存不足或调用栈深度过深,和虚拟机栈一样也会导致StackOverflowError和OutOfMemoryError异常。
Java堆(Heap)
- 被所有线程共享,在虚拟机启动时创建,用来存放对象实例,几乎所有的对象实例都在这里分配内存。
- 对于大多数应用来说,Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。
- Java堆是垃圾收集器管理的主要区域,因此很多时候也被称做“GC堆”。如果从内存回收的角度看,由于现在收集器基本都是采用的分代收集算法,所以Java堆中还可以细分为:新生代和老年代;新生代又有Eden空间、From Survivor空间、To Survivor空间三部分。
- Java 堆不需要连续内存,并且可以通过动态增加其内存,增加失败会抛出 OutOfMemoryError 异常。
JVM调优参数
上图很形象的说明了各个虚拟机调优命令的涵义:
-XX:MaxNewSize :最大的新生代内存(reserved为虚拟机保留的内存区域,以备内存不足时动态扩展用)
-XX:NewSize 最小新生代所需内存
-Xms 最小堆内存
-Xmx 最大堆内存
-XX:PermSize 最小持久代内存大小
-XX:MaxPermSize 最大持久代内存大小
其他参数:
-XX:NewRatio=n 表示设置年轻代和年老代的比值.如:为3,表示年轻代与年老代比值为1:3
-XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值.注意Survivor区有两个.如:3,表示Eden:Survivor=3:2,
垃圾回收统计信息:
-XX:+PrintGC 打印GC收集日志
-XX:+PrintGCDetails 打印详细的GC日志
并行收集器设置
-XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数.并行收集线程数.
-XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间
-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比.公式为1/(1+n)
并发收集器设置
-XX:+CMSIncrementalMode:设置为增量模式.适用于单CPU情况.
-XX:+UseCMSCompactAtFullCollection:使用并发收集器时,开启对年老代的压缩
- 并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。
- 并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行。而垃圾收集程序运行在另一个CPU上。
方法区(Method Area)
- 用于存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
- 和 Java 堆一样不需要连续的内存,并且可以动态扩展,动态扩展失败一样会抛出 OutOfMemoryError 异常。
- 对这块区域进行垃圾回收的主要目标是对类的卸载,但是一般比较难实现,HotSpot 虚拟机把它当成永久代(Permanent Generation)来进行垃圾回收。
- 方法区逻辑上属于堆的一部分,但是为了与堆进行区分,通常又叫“非堆”。
运行时常量池(Runtime Constant Pool)(JDK1.6及之前是放在方法区中,之后放到了老年代中了)
- 运行时常量池是方法区的一部分。
- Class 文件中的常量池(编译器生成的各种字面量和符号引用)会在类加载后被放入这个区域。
- 除了在编译期生成的常量,还允许动态生成,例如 String 类的 intern()。这部分常量也会被放入运行时常量池。
注:
- 在 JDK1.7之前,HotSpot 使用永久代实现方法区;HotSpot 使用 GC 分代实现方法区带来了很大便利;
- 从 JDK1.7 开始HotSpot 开始移除永久代。其中符号引用(Symbols)被移动到 Native Heap中,字符串常量和类引用被移动到 Java Heap中。
- 在 JDK1.8 中,永久代已完全被元空间(Meatspace)所取代。元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制。
方法区用于存放类信息,静态变量,常量等信息,JDK1.8之前方法区使用永久代实现,JDK1.8中方法区改为由元空间实现,元空间不在虚拟机中,而是使用的本地的内存。
直接内存(Direct Memory)
- 直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用,而且也可能导致OutOfMemoryError 异常出现。
- 在 JDK 1.4 中新加入了 NIO 类,引入了一种基于通道(Channel)与缓冲区(Buffer)的 I/O方式,它可以使用 Native 函数库直接分配堆外内存,然后通过一个存储在 Java 堆里的 DirectByteBuffer 对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java 堆和 Native 堆中来回复制数据。
JVM垃圾判断算法:
当JVM中内存不足时,JVM会去对堆中的垃圾进行回收处理,释放内存。所以第一步首先要确定的是哪些对象是垃圾,也就是可以被回收的,主要有以下几种算法.
1.引用计数法
给对象添加一个引用计数器,每当有一个地方引用他时计数器加一,当引用失效时计数器减一。
优点:算法效率高,实现简单
缺点:很难解决对象之间循环依赖的问题。
2.可达性分析算法
算法思路借鉴了图论中的思想,通过一系列被称为“GC ROOTS ”的对象为起点,从这些节点开始往下搜索,当一个对象和GCRoots之间没有任何引用链的时候说明这个对象是可以被回收的。
例如上图右边部分就是表示可以被回收的对象。
在Java语言中,可作为GC Roots 的对象包括下面几种
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中静态变量引用的对象
- 方法区中常量引用的对象
- 本地方法栈(即一般说的 Native 方法)中JNI引用的对象
优点:更加精确和严谨,可以分析出循环数据结构相互引用的情况;
缺点:实现比较复杂、需要分析大量数据,消耗大量时间、分析过程需要GC停顿(引用关系不能发生变化),即停顿所有Java执行线程(称为"Stop The World",是垃圾回收重点关注的问题)。
方法区内垃圾回收:
1.回收废弃常量
2.回收无用类
JVM垃圾回收算法:
1.标记清除
标记清除分为两步,标记和清除。
标记:会有两次标记,通过可达性分析算法后标记出可以被回收的对象,并将其放入F-Queue队列中,对队列中的数据进行二次标记,在执行finalize()方法时,如果对象重新与GC Root引用链上的任意对象建立了关联,则把他移除出“ 即将回收 ”集合。否则就等着被回收吧!!!
清除:对标记完的对象进行清除
优点:简单,基础
缺点:会产生很多的内存碎片,遇到创建大对象时可能会提前触发一次GC
2.复制算法
适用于新生代内存区域
将可用内存按容量分为大小相等的两块,每次只使用其中一块,当这一块的内存用完了,就将还存活的对象复制到另外一块内存上,然后再把已使用过的内存空间一次清理掉。
优点:实现简单,效率高。解决了标记-清除算法导致的内存碎片问题。
缺点:代价太大,将内存缩小了一半。效率随对象的存活率升高而降低。
3.标记整理
根据老年代的特点应运而生
标记:和标记清除算法一致
清理:
和标记-清理不同的是,该算法不是针对可回收对象进行清理,而是根据存活对象进行整理。让存活对象都向一端移动,然后直接清理掉边界以外的内存。
标记-整理算法示意图
优点:不会像复制算法那样随着存活对象的升高而降低效率,不像标记-清除算法那样产生不连续的内存碎片
缺点:效率问题,除了像标记-清除算法的标记过程外,还多了一步整理过程,效率更低。
4.分代收集算法
目前的商用虚拟机都采用了分代收集算法,简单来说该算法就是把JVM分成了几块,比如新生代,老年代。针对不同的区域采用不同的回收算法。
新生代中适合使用复制算法,因为每次进行垃圾回收都会发现大量对象死去,只需要付出少量存活对象的复制成本就可以完成收集。
老年代中适合标记清除和标记整理,因为对象存活率较高,没有额外的空间进行分配担保
垃圾收集器
1.Serial收集器,最基本发展最悠久的收集器,单线程收集器,在他进行垃圾收集的时候,必须暂停所有的工作线程直到收集完成,也就是会stop-the-world。
2.ParNew收集器,Serial收集器的多线程版本
3.Parallel Scavenage收集器,新生代收集器,使用复制算法。
4.Serial old,Serial收集器的老年代版本
5.Parallel Old收集器,Parallel Scavenage收集器的老年代版本,使用多线程和标记整理算法。
6.CMS收集器,是一种以获取最短回收停顿时间为目标的收集器,(性能较好),基于标记清除算法实现的。
7.G1收集器,是当今收集器发展的最前沿成果之一,有如下特点:并行与并发,分代收集,空间整理,可预测的停顿。
参考:
链接:https://juejin.im/post/5ad5c0216fb9a028e014fb63