JVM详解

JVM虚拟机详解

JVM是什么?

JVM是一种用于计算设备的规范,它是一个虚拟出来的计算机,是通过在实际的计算机上仿真模拟计算机的各个功能来实现的。Java语言的一个非常重要的特点就是与平台的无关性。而使用Java虚拟机是实现这一特点的关键。每个Java虚拟机都着一个清晰的任务:执行Java程序。程序执行时虚拟机才启动,程序结束时它才停止。

JVM的生命周期?

  1. 启动。启动一个Java程序的时候,就产生了一个JVM实例。
  2. 运行。main方法是程序的入口,任何其他线程均有它启动。
  3. 消亡。当程序中所有非守护线程都终止时,JVM才退出。若安全管理器允许,程序也可以使用Runtime类或者System.exit()来退出程序。

Java中的线程

Java中的线程分为两种:守护线程(daemon)和普通线程(non-daemon)。守护线程是JVM自己使用的的线程,如GC。当然也可以自己设置守护线程,但包含main方法的初始线程不是守护线程。
只要JVM中还有普通线程在执行,JVM就不会停止。但如果有足够的权限,可以调用exit方法终止程序。

JVM的体系结构

  1. 类装载器(ClassLoader,用来装载.class文件)
  2. 执行引擎(执行字节码或本地方法)
  3. 运行时数据区(方法区、堆区、虚拟机栈、本地方法栈、程序计数器)

JVM类的加载机制

Java程序并不一个可执行文件,是由多个独立的类文件组成。这些类文件并非一次性全部装入内存,而是依据程序逐步载入

JVM的类加载是通过ClassLoader及其子类类完成的,类的层次关系和记载顺序可以由下图说明:
img

  1. Bootstrap ClassLoader
  • JVM的根ClassLoader,使用C++语言实现
  • 使用它加载Java的核心API:$JAVA_HOME/jre/lib/rt.jar,这个jar中包含了java规范定义的所有接口以及实现。
  • JVM启动时即初始化此ClassLoader
  1. Extension ClassLoader
  • 加载Java的扩展API(lib/ext中的类)
  1. App ClassLoader
  • 加载classpath目录下的class
  1. Custom ClassLoader
  • 属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss都会根据J2EE规范自行实现ClassLoader

类在加载之前会先被检查是否已被加载,检查下的顺序是自底向上,从Custom ClassLoader到Bootstrap ClassLoader逐层检查,只要某个ClassLoader检查到已加载就视为此类已加载。从而保证类只加载一次。 而加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类。

双亲委派机制

JVM在加载类时默认采用的是双亲委派机制。
通俗的讲,就是某个特定的类加载器在接到加载类的请求时,首先将加载任务委托给父类加载器,依次递归。如果父类加载器可以完成类加载任务,就成功返回;只有父类加载器无法完成此加载任务时,才自己去加载。
img

为什么使用这种机制
  1. 避免了类被重复加载
  2. 更安全。如果有人想替换系统级别的类:String.java。篡改它的实现,在这种机制下这些系统的类已经被Bootstrap classLoader加载过了。(为什么?因为当一个类需要加载的时候,最先去尝试加载的就是BootstrapClassLoader。)所以其他类加载器并没有机会再去加载,从一定程度上防止了危险代码的植入。
破坏双亲委派机制

双亲委派机制并不是一种强制性的约束模型,而是Java设计者推荐给开发者的类加载器实现方式。

线程上下文类加载器,这个类加载器可以通过java.lang.Thread类的setContextClassLoader()方法进行设置,如果创建线程时还未设置,它将会从父线程中继承一个,如果在应用程序的全局范围内都没有设置过的话,那么这个类加载器就是应用程序类加载器。像JDBC就是采用了这种方式。这种行为就是逆向使用了加载器,违背了双亲委派模型的一般性原则。

类加载机制总结

img

JVM运行时数据区

img

堆区(Heap)

  1. 被所有线程共享的一块内存区域,在虚拟机启动时创建
  2. 用来存储对象实例
  3. 可以通过-Xms和-Xmx控制堆空间的大小
  4. OutOfMemory: 当堆中没有完成实例分配,且堆再也无法扩展时。

JVM堆是垃圾收集器管理的主要区域。
堆空间还可细分为:

  • 新生代(Eden/Young)[s0、s1]
  • 年老代(Tenured/Old)
  • 持久代(Permanent),在方法区,不属于堆

新生代: 新建的对象都有新生代分配内存。新生代常常又被划分为Eden和Survivor区,Eden空间不足时会把存活的对象转移到Survivor。新生代的大小可以使用-Xmn控制,也可用-XX:SurvivorRatio控制Eden和Survivor的比例。

年老代: 存放经过多次垃圾回收依然存活的对象

持久代: 存放静态文件,如今Java类、方法等。持久代在方法区,对垃圾回收没有显著影响。

方法区(Meta Space)

  • 线程间共享
  • 用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据等
  • OutOfMemoryError:当方法区无法满足内存分配时
  • 运行时常量池
    • 方法区的一部分
    • 用于编译期生成的各种字面量与符号引用,如String类型的引用就存放在字符串常量池
    • OutOfMemoryError:当常量池无法在申请到内存时

Java虚拟机栈(VM Stack)

  • 线程私有,生命周期与线程相同
  • 存储方法的局部变量表(基本类型、对象引用)、操作数栈、动态链接、方法出口等信息
  • Java方法执行的内存模型,每个方法执行的同时都会创建一个栈帧,每个方法被调用直至完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
  • StackOverflowError:当线程请求的栈深度大于虚拟机所允许的深度
  • OutOFMemoryError:如果栈的扩展时无法申请到足够的内存

JVM栈是线程私有的,每个线程创建的同时都会创建JVM栈,JVM栈中存放的为当前线程中局部基本类型的变量、部分的返回结果以及Stack Frame。其他引用类型的对象在JVM栈上仅存放变量名指向堆上对象实例的首地址。

本地方法栈(Native Method Stack)

  • 与虚拟机栈相似,主要是为虚拟机使用到的本地方法服务,在HotSpot虚拟机中和虚拟机栈合二为一

程序计数器(Programma Counter Register)

  • 当前线程所执行的字节码的行号指示器
  • 当前线程私有
  • 不会出现OutOfMemoryError

直接内存(Direct Memory)

  • 直接内存并不是虚拟机运行的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁使用
  • NIO可以使用Native函数库直接分配堆外内存,堆中的DirectByteBuffer对象作为这块内存的引用进行操作
  • 大小不受Java堆大小的限制,受本机(服务器)内存限制
  • OutOfMemoryError异常:系统内存不足时

总结:

  • Java对象实例存放在堆中,常量存放在方法区的常量池;
  • 虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据存放在方法区;
  • 以上区域是线程共享的
  • 栈是线程私有的,存放该方法的局部变量表(基本类型、对象引用)、操作数栈、动态链接、方法出口等信息。
  • 一个Java程序对应着一个JVM实例,一个方法(线程)对应一个虚拟机栈

Java代码的编译和执行过程

Java代码的编译和执行包括了三个重要机制:
(1)Java源码编译机制(.java -> .class)
(2)类加载机制(ClassLoader)
(3)类执行机制(执行引擎)

Java源码编译机制

Java源代码是不能被机器识别的,需要先经过编译器编译成JVM可以执行的.class字节码文件,再由解释器解释运行。
即:Java源文件(.java) – Java编译器 --> Java字节码文件 (.class) – Java解释器 --> 执行。

  • 字节码文件(.class)是平台无关的
  • Java中字符只以一种形式存在:Unicode。字符转换发生在JVM和OS交界处(Reader/Writer)
  • 最后生成的class文件由以下部分组成:
    • 结构信息。包括class文件格式版本号及各部分的数量与大小的信息
    • 元数据。对应于Java源码中声明与常量的信息。包含类/继承的超类/实现的接口的声明信息、域与方法声明信息和常量池
    • 方法信息。对应Java源码中语句和表达式对应的信息。包含字节码、异常处理器表、求值栈与局部变量区大小、求值栈的类型记录、调试符号信息

类加载机制在上面已经提到

类执行机制

Java字节码的执行是由JVM执行引擎来完成,流程图如下所示:
img

JVM是基于栈的体系结构来执行class字节码的。
线程创建后,都会产生程序计数器(PC)和栈(Stack),程序计数器存放下一条要执行的指令在方法内的偏移量,栈中存放一个个栈帧,每个栈帧对应着每个方法的每次调用,而栈帧又是有局部变量区和操作数栈两部分组成,局部变量区用于存放方法中的局部变量和参数,操作数栈中用于存放方法执行过程中产生的中间结果。

主要的执行技术:解释,即时编译,自适应优化、芯片级直接执行

  • 解释属于第一代JVM
  • 即时编译JIT属于第二代JVM
  • 自适应优化(目前Sun的HotspotJVM采用这种技术)则吸取第一代JVM和第二代JVM的经验,采用两者结合的方式

开始对所有的代码都采取解释执行的方式,并监视代码执行情况。对那些经常调用的方法启动一个后台线程,将其编译为本地代码,并进行优化。若方法不再频繁使用,则取消编译过的代码,仍对其进行解释执行。

JVM垃圾回收

**GC的基本原理:**将内存中不再被引用的对象进行回收,GC中用于回收的方法称为收集器。垃圾:不再被引用的对象。

由于GC需要消耗一些资源和时间,Java在对对象的生命周期特征进行分析后,按照新生代、旧生代的方式来对对象进行收集,以尽可能的缩短GC对应用造成的暂停。

  • 对新生代的对象的收集称为minor GC
  • 对旧生代的对象的收集称为Full GC
  • 程序中主动调用System.gc()的GC为Full GC

Java垃圾回收是单独的后台线程gc执行的,自动运行无需显示调用。即使主动调用了java.lang.System.gc(),该方法也只会提醒系统进行垃圾回收,但系统不一定会回应,可能会不予理睬。

判断一块内存空间是否符合回收标准:

  • 对象引用赋予了空值,且之后再未调用(obj = null;)
  • 对象引用赋予了新值,即重新分配了内存空间(obj = new Obj();)

内存泄漏: 程序中保留着对永远不再使用的对象的引用。因此这些对象不回被GC回收,却一直占用内存空间却毫无用处。
即:1)对象是可达的;2)对象是无用的。满足这两个条件即可判定为内存泄漏。

应确保不需要的对象不可达,通常采用将对象字段设置为null的方式,或从容器collection中移除对象。局部变量不再使用时无需显示设置为null,因为对局部变量的引用会随着方法的退出而自动清除。

内存泄露的原因: 1)全局集合;2)缓存;3)ClassLoader

JVM内存调优

调优目的: 减少GC的频率尤其是Full GC的次数,过多的GC会占用很多系统资源影响吞吐量。特别要关注Full GC,因为它会对整个堆进行整理。

主要手段: JVM调优主要通过配置JVM的参数来提高垃圾回收的速度,合理分配堆内存各部分的比例。

导致Full GC的几种情况和调优策略:

  • 旧生代空间不足
  • 调优时尽量让对象在新生代GC时被回收、让对象在新生代多存活一段时间和不要创建过大的对象及数组避免直接在旧生代创建对象
  • 持久代(Pemanet Generation)空间不足
    增大Perm Gen空间,避免太多静态对象
  • 统计得到的GC后晋升到旧生代的平均大小大于旧生代剩余空间控制好新生代和旧生代的比例
  • System.gc()被显示调用
    垃圾回收不要手动触发,尽量依靠JVM自身的机制

堆内存比例不良设置会导致什么后果:

1)新生代设置过小

一是新生代GC次数非常频繁,增大系统消耗;二是导致大对象直接进入旧生代,占据了旧生代剩余空间,诱发Full GC

2)新生代设置过大

一是新生代设置过大会导致旧生代过小(堆总量一定),从而诱发Full GC;二是新生代GC耗时大幅度增加

一般说来新生代占整个堆1/3比较合适

3)Survivor设置过小

导致对象从eden直接到达旧生代,降低了在新生代的存活时间

4)Survivor设置过大

导致eden过小,增加了GC频率

另外,通过-XX:MaxTenuringThreshold=n来控制新生代存活时间,尽量让对象在新生代被回收

JVM提供两种较为简单的GC策略的设置方式:

1)吞吐量优先

JVM以吞吐量为指标,自行选择相应的GC策略及控制新生代与旧生代的大小比例,来达到吞吐量指标。这个值可由-XX:GCTimeRatio=n来设置

2)暂停时间优先

JVM以暂停时间为指标,自行选择相应的GC策略及控制新生代与旧生代的大小比例,尽量保证每次GC造成的应用停止时间都在指定的数值范围内完成。这个值可由-XX:MaxGCPauseRatio=n来设置

JVM常见配置

  1. 堆设置
    -Xms:初始堆大小
    -Xmx:最大堆大小
    -XX:NewSize=n:设置年轻代大小
    -XX:NewRatio=n:设置年轻代和年老代的比值。如:为3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代和的1/4
    -XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如:3,表示Eden:Survivor=3:2,一个Survivor区占整个年轻代的1/5
    -XX:MaxPermSize=n:设置持久代大小
  2. 收集器设置
    -XX:+UseSerialGC:设置串行收集器
    -XX:+UseParallelGC:设置并行收集器
    -XX:+UseParalledlOldGC:设置并行年老代收集器
    -XX:+UseConcMarkSweepGC:设置并发收集器
  3. 垃圾回收统计信息
    -XX:+PrintGC
    -XX:+PrintGCDetails
    -XX:+PrintGCTimeStamps
    -Xloggc:filename
  4. 并行收集器设置
    -XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。5. 并行收集线程数。
    -XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间
    -XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)
  5. 并发收集器设置
    -XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况。
    -XX:ParallelGCThreads=n:设置并发收集器年轻代收集方式为并行收集时,使用的CPU数。并行收集线程数。

JVM常见问题

  1. 如何理解JVM?(一种JAVA虚拟机规范,基于此规范有不同JVM产品)
    答:JVM是一种用于计算设备的规范,它是一个虚拟出来的计算机,是通过在实际的计算机上仿真模拟计算机的各个功能来实现的。Java语言的一个非常重要的特点就是与平台的无关性。而使用Java虚拟机是实现这一特点的关键。每个Java虚拟机都着一个清晰的任务:执行Java程序。程序执行时虚拟机才启动,程序结束时它才停止。
  2. 你了解有哪些JVM产品?
    答:HotSpot,Sun JDK和OpenJDK中所带的虚拟机,也是目前使用范围最广的虚拟机。
    HotSpot VM的热点代码探测能力可以通过执行计数器找出最具有编译价值的代码,然后通知JIT编译器以方法为单位进行编译。
  3. 哪些程序代码会被编译为本地代码?如何编译为本地代码?
    答:程序中的代码只有是热点代码时,才会编译为本地代码
    的一个非常重要的特点就是与平台的无关性。而使用Java虚拟机是实现这一特点的关键。每个Java虚拟机都着一个清晰的任务:执行Java程序。程序执行时虚拟机才启动,程序结束时它才停止。
  4. 你了解有哪些JVM产品?
    答:HotSpot,Sun JDK和OpenJDK中所带的虚拟机,也是目前使用范围最广的虚拟机。
    HotSpot VM的热点代码探测能力可以通过执行计数器找出最具有编译价值的代码,然后通知JIT编译器以方法为单位进行编译。
  5. 哪些程序代码会被编译为本地代码?如何编译为本地代码?
    答:程序中的代码只有是热点代码时,才会编译为本地代码
    热点代码:(1)被多次调用的方法
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值