JAVA虚拟机(JVM)

一、什么是Java虚拟机

JVM是Java Virtual Machine的缩写,即Java虚拟机。

Java虚拟机只要有两方面作用:

1.Java语言是平台无关的语言,即一次编译就可以在不同的平台上运行。这主要是靠Java虚拟机的配合。在不同系统中需要安装对应系统的Java虚拟机,而编译后的Java代码是运行在Java虚拟机上的。所以,Java虚拟机帮助Java程序隔离了系统的差异。

2.Java语言与C语言、C++相比复杂性和开发难度大大降低,这主要归功于Java的内存托管机制,即我们在编写程序时无需过多考虑内存的分配与释放,Java虚拟机会帮助我们完成内存的管理。

二、JVM组成部分

JVM包含两个子系统和两个组件,两个子系统为Class loader(类装载)、Execution engine(执行引擎);两个组件为Runtime data area(运行时数据区)、Native Interface(本地接口)。

  • Class loader(类装载):根据给定的全限定名类名(如:java.lang.Object)来装载class文件到Runtime data area中的method area。

  • Execution engine(执行引擎):执行classes中的指令。

  • Native Interface(本地接口):与native libraries交互,是其它编程语言交互的接口。

  • Runtime data area(运行时数据区域):这就是我们常说的JVM的内存。

    • 程序计数器(Program Counter Register):当前线程所执行的字节码的行号指示器,字节码解析器的工作是通过改变这个计数器的值,来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能,都需要依赖这个计数器来完成;

    • Java 虚拟机栈(Java Virtual Machine Stacks):用于存储局部变量表、操作数栈、动态链接、方法出口等信息;

    • 本地方法栈(Native Method Stack):与虚拟机栈的作用是一样的,只不过虚拟机栈是服务 Java 方法的,而本地方法栈是为虚拟机调用 Native 方法服务的;

    • Java 堆(Java Heap):Java 虚拟机中内存最大的一块,是被所有线程共享的,几乎所有的对象实例都在这里分配内存;

    • 方法区(Methed Area):用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。

作用:通过编译器把 Java 代码转换成字节码,类加载器(ClassLoader)再把字节码加载到内存中,将其放在运行时数据区(Runtime data area)的方法区内,而字节码文件只是 JVM 的一套指令集规范,并不能直接交给底层操作系统去执行,因此需要特定的命令解析器执行引擎(Execution Engine),将字节码翻译成底层系统指令,再交由 CPU 去执行,而这个过程中需要调用其他语言的本地库接口(Native Interface)来实现整个程序的功能。

三、内存分配

JVM在操作系统上启动,申请内存,先进行运行时数据区的初始化,然后把类加载到方法区,最后执行方法。方法的执行和退出过程在内存上的体现就是虚拟机栈中栈帧的入栈和出栈。同时在方法的执行过程中创建的对象一般情况下都是放在堆中,最后堆中的对象也是需要进行垃圾回收清理的。

1.JVM向系统申请内存

JVM 第一步就是通过配置参数或者默认配置参数向操作系统申请内存空间,操作系统根据内存大小找到具体的内存分配表,然后把内存段的起始地址和终止地址分配给 JVM,接下来 JVM 就进行内部分配。

一般分为两种:静态内存和动态内存

  • 静态内存:在编译时就能确定的内存是静态内存,比如局部的基本类型变量和类引用等,这类内存的长度往往是固定。Java栈、本地方法栈、程序计数器,这些都是长度固定而且是线程私有,当线程销毁时内存自然就跟着回收了。

  • 动态内存:在程序执行时才会知道要分配多少内存,比如我们在程序执行时才会知道对象是否会被真正的创建,而且每个对象占用的空间会有所不同。经过一次分配与回收之后,内存会存在很多碎片。这就导致我们需要一个相对复杂的策略来分配和回收这部分内存,不断地消除内存的碎片化。

2. 初始化运行时数据区

JVM 获得内存空间后,会根据配置参数分配堆、栈以及方法区的内存大小

3. 类加载

这里主要是把 class 放入方法区、还有 class 中的静态变量和常量也要放入方法区

4. 执行方法及创建对象

启动 main 线程,执行 main 方法,按代码顺序执行,完成对象的创建和方法调用

4.1对象的创建

  1. 虚拟机遇到new指令后,首先检查new指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否被加载,解析和初始化过。如果没有,那必须先执行类的加载过程;

  2. 类加载检查通过之后,接着会在Java堆中划分一块内存分配给对象。内存分配根据Java堆是否规整,有指针碰撞空闲列表两种分配方式:选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的GC是否带有压缩整理功能决定;因此,在使用Serial、ParNew等带Compact过程的收集器时,系统采用的分配算法时指针碰撞,而使用CMS这种基于Mark-Sweep算法的收集器时,通常采用空闲列表。

  3. 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值;

  4. 对对象进行必要的设置,例如这个对象是哪个类的实例,如果才能找到类的元数据信息,对象的哈希码,对象的GC分代年龄等信息(这些对象存放在对象的对象头Object Header中)

  5. 执行init方法,把对象按照程序员的意愿进行初始化。

此外还有对象创建的并发问题:

  • 堆分配内存空间的动作进行同步处理–采用CAS配上失败重试的方式保证更新操作的原子性;

  • 把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓存(Thread Local Allocation Buffer,TLAB)

四、垃圾回收机制

1.检测垃圾算法

垃圾检测法有引用计数法和可达性算法。

引用计数法

引用计数算法的基本思想就是每个对象都有一个引用计数器,当对象在某处被引用的时候,它的引用计数器就加1,引用失效时就减1。当引用计数器中的值变为0,则该对象就不能被使用成了垃圾。

目前主流的Java虚拟机没有选择引用计数算法来为垃圾标记,主要原因是引用计数算法没有解决对象之间相互循环引用的问题。

可达性算法

从 GC Roots 开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。

GC Roots 对象包括:

虚拟机栈中引⽤的对象

本地⽅法栈中Native⽅法引⽤的对象

⽅法区中类静态属性引⽤的对象

⽅法区中常量引⽤的对象

所有被同步锁synchronized持有的对象

Java虚拟机内部的引⽤,Class对象、异常、类加载器等。

反映java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

2.回收算法

标记-清除算法

分为两个阶段,标记阶段和清除阶段。标记阶段的任务是标记出所有需要被回收的对象,然后统一回收。这是最基础的算法,后续收集算法都是基于这个算法扩展的。不足:效率低,清除后会产生大量碎片。

复制算法

把空间划分成两个区域,每次只是用其中一个区域。垃圾回收时遍历当前正在使用的区域,把正在使用的对象复制到另外一个空白区域。该方法能够避免碎片问题。不足:需要额外的内存空间。

标记-整理

先做标记,然后把标记后的对象向一端移动,然后直接清理掉边界意外的内存空间。不足:移动对象成本高。

分代收集算法

这是当前商业虚拟机常用的垃圾回收算法。分代回收策略是基于这样一个事实:不同对象的生命周期是不一样的。因此不同生命周期的对象可以采取不同的回收方式。可提高效率。Yung区采用复制算法,old区采用标记-整理算法。

3.垃圾回收器

在java中,程序员是不需要显示的去释放一个对象的内存的,而是由虚拟机自行执行。在JVM中,有一个垃圾回收线程,它是低优先级的,在正常情况下是不会执行的,只有在虚拟机空闲或者当前堆内存不足时,才会触发执行,扫面那些没有被任何引用的对象,并将它们添加到要回收的集合中,进行回收。

  • Serial收集器(复制算法)

    新生代单线程收集器,标记和清理都是单线程,优点是简单高效;

  • ParNew收集器 (复制算法)

    新生代收并行集器,实际上是Serial收集器的多线程版本,在多核CPU环境下有着比Serial更好的表现;

  • Parallel Scavenge收集器 (复制算法)

    新生代并行收集器,追求高吞吐量,高效利用 CPU。吞吐量 = 用户线程时间/(用户线程时间+GC线程时间),高吞吐量可以高效率的利用CPU时间,尽快完成程序的运算任务,适合后台应用等对交互相应要求不高的场景;

  • Serial Old收集器 (标记-整理算法)

    老年代单线程收集器,Serial收集器的老年代版本;

  • Parallel Old收集器 (标记-整理算法)

    老年代并行收集器,吞吐量优先,Parallel Scavenge收集器的老年代版本;

  • CMS(Concurrent Mark Sweep)收集器(标记-清除算法)

    老年代并行收集器,以获取最短回收停顿时间为目标的收集器,具有高并发、低停顿的特点,追求最短GC回收停顿时间。

运作过程分为:

初始标记:仅仅只是标记一下GC Roots能直接关联到的对象,速度很快

并发标记:进行GC Roots Tracing的过程

重新标记:为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始阶段稍长一些,但远比并发标记的时间短。

并发清除:清除标记垃圾

优点:并发收集、低停顿

缺点:无法处理浮动垃圾、将产生大量的内存碎片

  • G1(Garbage First)收集器 (标记-整理算法)

    Java堆并行收集器,G1回收的范围是整个Java堆(包括新生代,老年代),它将整个Java划分为多个大小相等的独立区域(Region),保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,都是一部分Region(不需要连续)的集合。

    Region的大小数值是在1M到32M字节之间的一个2的幂值数,JVM会尽量划分2048个左右、同等大小的Region.G1会通过一个合理的计算模型,计算出每个Region的收集成本并量化,这样一来,收集器在给定了“停顿”时间限制的情况下,总是能选择一组恰当的Regions作为收集目标,让其收集开销满足这个限制条件,以此达到实时收集的目的。

运作过程分为:

初始标记:仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的Region中创建新对象,这阶段需要停顿线程,但耗时很短。

并发标记:是从GC Roots开始堆中对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户程序并发执行

最终标记:是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在线程Remembered Set Logs里面,最终标记阶段需要把Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程,但是可并行执行。

筛选回收:首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划。这个阶段也可以做到与用户程序一起并发执行,但是因为只回收一部分Region,时间是用户可控制的,而且停顿用户线程将大幅提高收集效率。

优点:可指定最大停顿时间、按回收收益收集、低内存碎片

缺点:内存占用高、执行负载高

在小内存的机器上CMS大概率表现得比G1更好,而大内存则G1的优势更加明显。大小内存的平衡点在6-8G之间。

五、虚拟机类加载机制

类加载机制就是jvm从文件系统将一系列的 class 文件z转化为二进制流加载 JVM 内存中并生成一个该类的Class对象,为后续程序运行提供资源的动作。

Java中的所有类,都需要由类加载器装载到JVM中才能运行。类加载器本身也是一个类,而它的工作就是把class文件从硬盘读取到内存中。在写程序的时候,我们几乎不需要关心类的加载,因为这些都是隐式装载的,除非我们有特殊的用法,像是反射,就需要显式的加载所需要的类。

1.类装载方式

隐式装载, 程序在运行过程中当碰到通过new 等方式生成对象时,隐式调用类装载器加载对应的类到jvm中,

显式装载, 通过class.forname()等方法,显式加载需要的类

Java类的加载是动态的,它并不会一次性将所有类全部加载后再运行,而是保证程序运行的基础类(像是基类)完全加载到jvm中,至于其他类,则在需要的时候才加载。这当然就是为了节省内存开销。

2.类装载的执行过程

  • 加载:根据查找路径找到相应的 class 文件然后导入;

  • 验证:检查加载的 class 文件的正确性;

  • 准备:给类中的静态变量分配内存空间;

  • 解析:虚拟机将常量池中的符号引用替换成直接引用的过程。符号引用就理解为一个标示,而在直接引用直接指向内存中的地址;

  • 初始化:对静态变量和静态代码块执行初始化工作。

3.类加载器

实现通过类的权限定名获取该类的二进制字节流的代码块叫做类加载器。

主要有一下四种类加载器:

  • 启动类加载器(Bootstrap ClassLoader)用来加载java核心类库,无法被java程序直接引用。

  • 扩展类加载器(extensions class loader):它用来加载 Java 的扩展库。Java 虚拟机的实现会提供一个扩展库目录。该类加载器在此目录里面查找并加载 Java 类。

  • 系统类加载器(system class loader):它根据 Java 应用的类路径(CLASSPATH)来加载 Java 类。一般来说,Java 应用的类都是由它来完成加载的。可以通过 ClassLoader.getSystemClassLoader()来获取它。

  • 用户自定义类加载器,通过继承 java.lang.ClassLoader类的方式实现。

4.双亲委派模型

如果一个类加载器收到了类加载的请求,它首先不会自己去加载这个类,而是把这个请求委派给父类加载器去完成,每一层的类加载器都是如此,这样所有的加载请求都会被传送到顶层的启动类加载器中,只有当父加载无法完成加载请求(它的搜索范围中没找到所需的类)时,子加载器才会尝试去加载类。

当一个类收到了类加载请求时,不会自己先去加载这个类,而是将其委派给父类,由父类去加载,如果此时父类不能加载,反馈给子类,由子类去完成类的加载。

六、JVM调优

JVM 调优工具

JDK 自带了很多监控工具,都位于 JDK 的 bin 目录下,其中最常用的是 jconsole 和 jvisualvm 这两款视图监控工具。

  • jconsole:用于对 JVM 中的内存、线程和类等进行监控;

  • jvisualvm:JDK 自带的全能分析工具,可以分析:内存快照、线程快照、程序死锁、监控内存的变化、gc 变化等。

常用的 JVM 调优的参数

  • -Xms2g:初始化推大小为 2g;

  • -Xmx2g:堆最大内存为 2g;

  • -XX:NewRatio=4:设置年轻的和老年代的内存比例为 1:4;

  • -XX:SurvivorRatio=8:设置新生代 Eden 和 Survivor 比例为 8:2;

  • –XX:+UseParNewGC:指定使用 ParNew + Serial Old 垃圾回收器组合;

  • -XX:+UseParallelOldGC:指定使用 ParNew + ParNew Old 垃圾回收器组合;

  • -XX:+UseConcMarkSweepGC:指定使用 CMS + Serial Old 垃圾回收器组合;

  • -XX:+PrintGC:开启打印 gc 信息;

  • -XX:+PrintGCDetails:打印 gc 详细信息。

七、常见问题

1.简述分代垃圾回收器是怎么工作的?

分代回收器有两个分区:老生代和新生代,新生代默认的空间占比总空间的 1/3,老生代的默认占比是 2/3。

新生代使用的是复制算法,新生代里有 3 个分区:Eden、To Survivor、From Survivor,它们的默认占比是 8:1:1,它的执行流程如下:

  • 把 Eden + From Survivor 存活的对象放入 To Survivor 区;

  • 清空 Eden 和 From Survivor 分区;

  • From Survivor 和 To Survivor 分区交换,From Survivor 变 To Survivor,To Survivor 变 From Survivor。

每次在 From Survivor 到 To Survivor 移动时都存活的对象,年龄就 +1,当年龄到达 15(默认配置是 15)时,升级为老生代。大对象也会直接进入老生代。

老生代当空间占用到达某个值之后就会触发全局垃圾收回,一般使用标记整理的执行算法。以上这些循环往复就构成了整个分代垃圾回收的整体执行流程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值