【知识点】JVM

5 篇文章 0 订阅
3 篇文章 0 订阅

知识点总结,直接上干货

JVM基本结构
JVM类加载机制
JVM运行时内存区域
JVM堆内存区域
JVM虚拟机栈
JVM垃圾回收机制
JVM垃圾回收算法
JVM常见垃圾收集器
JVM性能调优

JVM基本机构

如图所示,JVM主要包括 类加载子系统、运行时内存区域、垃圾回收、PC寄存器、执行引擎、本地方法接口、本地方法库几部分。

1. 类加载器子系统

      顾名思义,主要作用是用来加载.class二进制文件到JVM内存区域。

1.1 JVM类加载机制

如图所示,JVM类加载机制包括加载、连接(验证、准备、解析)、初始化三个过程。

加载:类加载中的第一个阶段,通过java类的全限定名找到.class二进制文件,加载到运行时内存区域的方法区中,并在内存中为其生成一个Clazz对象,类似指针,作为该类在方法区访问入口。
连接:连接分为三步,验证-准备-解析
     验证:验证第一步加载的.class字节码文件是否正确(JVM要加载的二进制文件,有一套约定好的定义,比如版本号、类定义、变量说明、方法说明等)
     准备:准备阶段简单来说就是为静态变量赋值0或null(对于常量而言,在准备阶段会完成赋值)
     解析:解析阶段简单来说就是将符号引用转换为直接引用的过程(所谓符号引用就是.class二进制文件中的符号定义(如CONSTANT**),JVM一次编译多次运行就体现在此,源代码被编译成二进制文件后,各种操作系统上的JVM就可以对其进行解释,翻译成操作系统可以识别的指令集)
初始化:初始化操作是类加载中的最后一个阶段,可以简单理解为为静态变量赋值,体现在二进制文件的<Clinit>方法中,若一个类没有静态变量或静态代码块,编译器可以不用生成该方法。

    【思考】第一步加载过程中生成的Clazz对象保存在哪儿?

where:JDK1.7之前Clazz对象保存在方法区中,JDK1.8之后永久代取消,新增了元数据区,class二进制文件保存在元数据区(本地内存),Clazz对象保存在堆内存中。

1.2 类加载器

  如图所示,JVM提供了三种类加载器:启动类加载器、扩展类加载器、应用程序类加载器、以及自定义类加载器。

启动类加载器:负责加载JAVA_HOME\lib 目录中的类文件,如rt.jar包中的启动类。
扩展类加载器:负责加载JAVA_HOME\lib\ext 目录中的扩展类,主要指的是一些功能扩展类。
应用程序类加载器:负责加载classpath类路径下的类,主要是业务类等。

1.3 双亲委派模型

   所谓双亲委派,指的是一个类加载器在收到类加载的请求时,先不尝试进行加载,而是向上一级(父加载器)做出请示,让其进行加载,每级都会如此,直到启动类加载器。若上级均不能对该类进行加载时,再有该类加载器进行加载。

双亲委派的优势:
1. 保证一个系统中的一个类只能被加载一次
2. 保证加载的类都是正确的,不会对JVM造成损害(启动类只能有启动类加载器加载,启动类加载器本身对启动类最熟悉,能保证其没有被篡改)

2. 运行时内存区域

如图所示,JVM运行时内存区域包含,堆、栈(虚拟机栈)、方法区、程序计数器、本地方法栈

堆:引用对象(对象和数组)创建在此处(该区域线程共享)
方法区:.class二进制文件被加载到此处,此外还有常量池(该区域线程共享)
栈(虚拟机栈):JVM为每一个线程分配一个栈,为每个方法分配一个栈帧,所以栈中可能包含多个栈帧。栈帧主要由:局部变量表、操作数栈、动态连接(符号引用)、方法出口(返回地址或异常出口),(该区域线程私有)
本地方法栈:同虚拟机栈,主要指的是本地方法的调用,JVM虚拟机会调用C、C++的底层接口,从而和操作系统进行交互
程序计数器:主要指的是当前程序运行到哪一行指令(对于本地方法,程序计数器没有值undefined)

3. JVM堆内存

如图所示,JVM堆内存根据对象的存活时间进行了划分,新生代(Eden、Survivor From、Survivor to),老年代。

新生代:对象存活时间短,一次GC能回收大多数的内存,一般使用复制算法
老年代:对象存活时间长,一般是大对象,一次GC回收的内存较少,一般采用标记-清除或标记-整理算法
新生代:老年代一般为1:2,JVM调优时要根据具体的业务进行调整,新生代小了,老年代大了,minor GC频率变大,一次major GC可能耗时较长;新生代大了,老年代小了,minor GC频率变小,一次major GC可能耗时变短。

4. JVM虚拟机栈

每个方法的执行会随之分配一个栈帧,栈帧里包含操作数栈,操作数栈主要保存当前变量的值,或中间临时数据,这里要重点关注一些++、--的基础运算,临时数据会被赋值给变量值,特别注意此点。

5. JVM垃圾回收机制

java语言相比C、C++语言来说,垃圾回收机制解决了程序员不少问题(如不需要手动释放内存空间),不过也可能带来内存溢出的麻烦。

对于垃圾回收,主要关注以下三点:
1. 什么是垃圾
2. 垃圾什么时候进行回收
3. 垃圾如何回收

5.1 什么是垃圾

主要两种方式来判断什么样的对象变成了垃圾:引用计数法、可达性分析。对于前者存在循环引用无法判断的缺点,对于后者要知道通常是哪些引用。

GC Roots:虚拟机栈中的引用、类中的常量引用、类中的静态变量引用、jni中的引用

5.2 垃圾什么时候进行回收

一般来说,在CPU空闲的时候,就可能会进行垃圾的回收,垃圾回收时机有JVM自己控制。调用system.gc告知JVM可以尝试回收垃圾。finallize方法中可以使当前对象重新激活。

5.3 垃圾如何回收

垃圾如何回收牵涉到垃圾回收算法以及垃圾收集器,见如下章节。

6. 垃圾回收算法

常见算法:
1. 复制算法(新生代):简单。
2. 标记清除算法(老年代):存在内存碎片
3. 标记整理算法(老年代):不存在内存碎片、相对耗时。
4. 分代思想(衍生出分代算法,根据分代,分别使用不同的算法进行收集):根据堆内存分配中不同区域的对象的存活时间特殊对待。

7. 垃圾收集器

如图所示,JDK1.7/1.8之后,Hotspot中垃圾收集器主要有7种。可根据新生代、老年代进行划分,也可以根据串行、并行进行划分。

Serial:单线程、复制、新生代垃圾收集器
ParNew:多线程、复制、新生代垃圾收集器(Serial的多线程版本)
Parallal Scavenge:多线程、复制、新生代垃圾收集器(关注系统的吞吐量)

Serial Old:单线程、标记-整理、老年代垃圾收集器(Serial的老年代版本)
ParNew Old:多线程、标记-整理、老年代垃圾收集器(ParNew的老年代版本)
CMS(Concurrent Mark Sweep):多线程、标记-清除、老年代垃圾收集器(关注系统的吞吐量)

G1:分区收集,堆进行分区,各区又根据优先级进行排序。再最小GC停顿时间的同时,又不降低系统的吞吐量

8.JVM性能调优

一般而言,程序业务功能上的调优比JVM性能调优效果更显著,JVM性能调优是最后的一步。

8.1 GC参数

-Xmx:最大堆内存
-Xms:最小堆内存
-Xmn:
-Xss:
-XX:printGCDetails:
-XX:+UseParallelOldGC

8.2 GC日志

根据GC的日志查看新生代、老年代是否需要调优

8.3 JVM调优

粘贴复制一篇帖子一部分调优总结:
1.针对JVM堆的设置,一般可以通过-Xms -Xmx限定其最小、最大值,为了防止垃圾收集器在最小、最大之间收缩堆而产生额外的时间,通常把最大、最小设置为相同的值;
2.年轻代和年老代将根据默认的比例(1:2)分配堆内存, 可以通过调整二者之间的比率NewRadio来调整二者之间的大小,也可以针对回收代。
比如年轻代,通过 -XX:newSize -XX:MaxNewSize来设置其绝对大小。同样,为了防止年轻代的堆收缩,我们通常会把-XX:newSize -XX:MaxNewSize设置为同样大小。
3.年轻代和年老代设置多大才算合理
1)更大的年轻代必然导致更小的年老代,大的年轻代会延长普通GC的周期,但会增加每次GC的时间;小的年老代会导致更频繁的Full GC
2)更小的年轻代必然导致更大年老代,小的年轻代会导致普通GC很频繁,但每次的GC时间会更短;大的年老代会减少Full GC的频率
如何选择应该依赖应用程序对象生命周期的分布情况: 如果应用存在大量的临时对象,应该选择更大的年轻代;如果存在相对较多的持久对象,年老代应该适当增大。但很多应用都没有这样明显的特性。
在抉择时应该根 据以下两点:
(1)本着Full GC尽量少的原则,让年老代尽量缓存常用对象,JVM的默认比例1:2也是这个道理 。
(2)通过观察应用一段时间,看其他在峰值时年老代会占多少内存,在不影响Full GC的前提下,根据实际情况加大年轻代,比如可以把比例控制在1:1。但应该给年老代至少预留1/3的增长空间。
4.在配置较好的机器上(比如多核、大内存),可以为年老代选择并行收集算法: -XX:+UseParallelOldGC 。
5.线程堆栈的设置:每个线程默认会开启1M的堆栈,用于存放栈帧、调用参数、局部变量等,对大多数应用而言这个默认值太了,一般256K就足用。
理论上,在内存不变的情况下,减少每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统。

9.其它

9.1 进程和线程

进程和线程:个人认为,线程和进程的异同点不太好答,咋一看很简单,仔细一想无从可答,本身进程和线程是在技术发展到一定阶段的产物,可以说就没什么好比的。
进程:简单来讲,一个运行着的程序就叫做进程。进程是资源分配的最小单位,这里的资源指的寻址空间,寄存器组,堆栈空间。
线程:线程是操作系统执行的最小单位,是程序中的一串命令。

进程是资源分配的最小单位,线程是CPU调度的最小单位
相同点:均是CPU的时间片(只不过时间片大小不同)
不同点:进程是操作系统分配资源的最小单位,线程是CPU调度执行的最小单位,前者关注资源分配,后者更关注与调度执行

9.2 并发与并行

知乎上有个大神举了个例子:
你吃饭吃到一半,电话来了,你一直到吃完了以后才去接,这就说明你不支持并发也不支持并行。
你吃饭吃到一半,电话来了,你停了下来接了电话,接完后继续吃饭,这说明你支持并发。
你吃饭吃到一半,电话来了,你一边打电话一边吃饭,这说明你支持并行。
并发的关键是你有处理多个任务的能力,不一定要同时。
并行的关键是你有同时处理多个任务的能力。
所以我认为它们最关键的点就是:是否是『同时』。

【说明】有些地方未做验证,请保持怀疑态度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值