JVM
JVM是什么
Java Virtual Machine java程序的运行环境(java二进制字节码的运行环境)
JVM组成
- 类加载器:用于装载字节码文件(.class文件)
- 运行时数据区:用于分配存储空间
- 执行引擎:执行字节码文件或本地方法
- 垃圾回收器:用于对JVM中的垃圾内容进行回收
什么是程序计数器
程序计数器:线程私有的,内部保存的字节码的行号。用于记录正在执行的字节码指令的地址。
你能给我详细的介绍下JAVA堆吗
线程共享的区域:主要用来保存
对象实例,数组等
,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError异常。
- 组成:年轻代+老年代
- 年轻代被划分为三部分,Eden区和两个大小严格相同的Survivor区
- 老年代主要保存生命周期长的对象,一般是一些老的对象
- jdk1.7和1.8的区别
- 1.7中有有一个永久代,存储的是类信息、静态变量、常量、编译后的代码
- 1.8移除了永久代,把数据存储到了本地内存的元空间中,防止内存溢出
什么是虚拟机栈
Java Virtual machine Stacks (java 虚拟机栈)
什么是虚拟机栈呢?
每个线程运行时所需要的内存
,称为虚拟机栈
,先进后出
- 每个栈由多个
栈帧(frame)
组成,对应着每次方法调用时所占用的内存
- 每个线程只能有一个
活动栈帧
,对应着当前正在执行
的那个方法
垃圾回收是否涉及栈内存
垃圾回收主要是指堆内存,当栈帧弹栈以后,内存就会释放
栈内存分配越大越好吗
未必,默认的栈内存通常为1024k
栈帧过大会导致线程数变少,例如,机器总内存为512m,目前能活动的线程数则为512个,如果把栈内存改为2048k,那么能活动的栈帧就会减半
方法内的局部变量是否线程安全
- 如果方法内局部变量没有逃离方法的作用范围,它是线程安全的
- 如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
什么情况下会导致栈内存溢出
- 栈帧过多导致栈内存溢出,典型问题:递归调用
- 栈帧过大导致栈内存溢出
堆栈的区别是什么
- 栈内存一般会用来存储
局部变量
和方法调用
,但堆内存是用来存储Java对象
和数组
的。堆会GC垃圾回收,而栈不会。 - 栈内存是线程私有的,而堆内存是线程共有的。
- 两者异常错误不同,但如果栈内存或者堆内存不足则会抛出异常。
- 栈空间不足:java.lang.StackOverFlowError
- 堆内存不足:java.lang.OutOfMemoryError
能不能解释一下方法区
- 方法区(Method Area)是各个线程
共享的内存区域
- 主要存储类的信息、运行时常量池
- 虚拟机启动的时候创建,关闭虚拟机时释放
- 如果方法区域中的内存无法满足分配请求,则会抛出OutOfMemoryError:Metaspace
介绍一下运行时常量池
常量池是什么
可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
运行时常量池
常量池是 *.class 文件中的,当该类被加载,它的常量池信息就会放入
运行时常量池
,并把里面的符号地址
变为真实地址
你听过直接内存吗
并不属于JVM中的内存结构,不由JVM进行管理。
是虚拟机的系统内存,常见于NIO
操作时,用于数据缓冲区,它分配回收成本较高,但读写性能高
类加载器
什么是类加载器,类加载器有哪些
JVM只会运行二进制文件,类加载器的作用就是将
字节码文件加载到JVM中
,从而让Java程序能够启动起来。
- 启动类加载器(BootStrap ClassLoader):加载JAVA_HOME/jre/lib目录下的库
- 扩展类加载器(ExtClassLoader):主要加载JAVA_HOME/jre/lib/ext目录中的类
- 应用类加载器(AppClassLoader):用于加载classPath下的类
- 自定义类加载器(CustomizeClassLoader):自定义类继承ClassLoader,实现自定义类加载规则。
什么是双亲委派模型?
加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,子加载器尝试加载该类
JVM为什么采用双亲委派机制
- 通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性。
- 为了安全,保证类库API不会被修改
说一下类装载的执行过程
类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备和解析这三个部分统称为连接(linking)
加载
- 通过类的全名,获取类的二进制数据流。
- 解析类的二进制数据流为方法区内的数据结构(Java类模型)
- 创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口
验证
:验证类是否符合JVM规范,安全性检查
准备
: 为类变量分配内存并设置类变量初始值
解析
:把类中的符号引用转换为直接引用
方法中调用了其他方法,方法名可以理解为符号引用,而直接引用就是使用指针直接指向方法。
初始化
:对类的静态变量,静态代码快执行初始化操作
- 如果初始化一个类的时候,其父类尚未初始化,则优先初始化其父类。
- 如果同时包含多个静态变量和静态代码块,则按照自上而下的顺序依次执行。
使用
:JVM开始从入口方法开始执行用户的程序代码 - 调用静态类成员信息(比如:静态字段、静态方法)
- 使用new关键字为其创建对象实例
总结
:
- 加载:查找和导入class文件
- 验证:保证加载类的准确性
- 准备:为类变量分配内存并设置类变量初始值
- 解析:把类中的符号引用转换为直接引用
- 初始化:对类的静态变量,静态代码块执行初始化操作
- 使用:JVM 开始从入口方法开始执行用户的程序代码
- 卸载:当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象。
垃圾回收
对象什么时候可以被垃圾器回收
如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收。
怎么定位垃圾呢?
- 引用计数法
- 可达性分析算法
引用计数法
一个对象被引用了一次,在当前的对象头上递增一次引用次数,如果这个对象的引用次数为0,代表这个对象可回收
循环引用
可达性分析算法
扫描堆中的对象,看是否能够沿着 GC Root 对象 为起点的引用链找到该对象,找不到,表示可以回收
Java 虚拟机中的垃圾回收器采用可达性分析来探索所有存活的对象
哪些对象可以作为GC Root?
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中 JNI(即一般说的 Native 方法)引用的对象
JVM垃圾回收算法有哪些
- 标记清除算法
- 复制算法
- 标记整理算法
标记清除法
标记清除算法,是将垃圾回收分为2个阶段,分别是
标记
和清除
。
- 根据可达性分析算法得出的垃圾进行
标记
- 对这些标记为可回收的内容进行垃圾
回收
标记整理算法
标记清除算法一样,将存活对象都向内存另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
复制算法
将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收;无碎片,内存使用率低
优点:
- 在垃圾对象多的情况下,效率较高
- 清理后,内存无碎片
缺点: - 分配的2块内存空间,在同一个时刻,只能使用一半,内存使用率较低。
总结
:
- 标记清除算法:垃圾回收分为2个阶段,分别是标记和清除,效率高,有磁盘碎片,内存不连续
- 标记整理算法:标记清除算法一样,将存活对象都向内存另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
- 复制算法:将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收;无碎片,内存使用率低
说一下JVM中的分代回收
在java8时,堆被分为了两份:新生代和老年代【1:2】
对于新生代,内部又被分为了三个区域。
- 伊甸园区Eden,新生的对象都分配到这里
- 幸存者区survivor(分成from和to)
- Eden区,from区,to区【8:1:1】
分代收集算法-工作机制
- 新创建的对象,都会先分配到eden区
- 当伊甸园内存不足,标记伊甸园与 from(现阶段没有)的存活对象
- 将存活对象采用复制算法复制到 to 中,复制完毕后,伊甸园和 from 内存都得到释放
- 经过一段时间后伊甸园的内存又出现不足,标记eden区域to区存活的对象,将存活的对象复制到from区
- 当幸存区对象熬过几次回收(最多15次),晋升到老年代(幸存区内存不足或大对象会导致提前晋升)
MinorGC、 Mixed GC 、 FullGC的区别是什么
STW(Stop-The-World):暂停所有应用程序线程,等待垃圾回收的完成
- MinorGC【young GC】发生在新生代的垃圾回收,暂停时间短(STW)
- Mixed GC 新生代 + 老年代部分区域的垃圾回收,G1 收集器特有
- FullGC: 新生代 + 老年代完整垃圾回收,暂停时间长(STW),应尽力避免
说一下JVM有哪些垃圾回收器
在jvm中,实现了多种垃圾收集器,包括:
- 串行垃圾收集器
- 并行垃圾收集器
- CMS(并发)垃圾收集器
- G1垃圾收集器
串行垃圾收集器
Serial
和Serial Old
串行垃圾收集器,是指使用单线程进行垃圾回收,堆内存较小,适合个人电脑
- Serial 作用于新生代,采用复制算法
- Serial Old 作用于老年代,采用标记-整理算法
并行垃圾收集器
Parallel New和Parallel Old是一个并行垃圾回收器,
JDK8默认使用此垃圾回收器
- Parallel New作用于新生代,采用复制算法
- Parallel Old作用于老年代,采用标记-整理算法
CMS(并发)垃圾收集器
CMS全称 Concurrent Mark Sweep,是一款
并发的
、使用标记-清除
算法的垃圾回收器,该回收器是针对老年代
垃圾回收的,是一款以获取最短回收停顿时间
为目标的收集器,停顿时间短,用户体验就好。其最大特点是在进行垃圾回收时,应用仍然能正常运行。
为什么要重新标记呢?
因为之前在上一次并发标记时,应用仍在运行,在此期间有可能会出现产生新的垃圾或者有的垃圾不是垃圾了。
G1垃圾收集器
应用于新生代和老年代,在JDK9之后默认使用G1
- 划分成多个区域,每个区域都可以充当 eden,survivor,old, humongous,其中 humongous 专为大对象准备
- 采用复制算法
- 响应时间与吞吐量兼顾
- 分成三个阶段:新生代回收、并发标记、混合收集
- 如果并发失败(即回收速度赶不上创建新对象速度),会触发 Full GC
G1 年轻代垃圾回收(Young Collection)
- 初始时,所有区域都处于空闲状态
- 创建了一些对象,挑出一些空闲区域作为伊甸园区存储这些对象
- 当伊甸园需要垃圾回收时,挑出一个空闲区域作为幸存区,用复制算法复制存活对象,需要暂停用户线程
- 随着时间流逝,伊甸园的内存又有不足
- 将伊甸园以及之前幸存区中的存活对象,采用复制算法,复制到新的幸存区,其中较老对象晋升至老年代
Young Collection + Concurrent Mark (年轻代垃圾回收+并发标记)
当老年代占用内存超过阈值(默认是45%)后,触发并发标记
,这时无需暂停用户线程
- 并发标记之后,会有重新标记阶段解决漏标问题,此时需要暂停用户线程。
- 这些都完成后就知道了老年代有哪些存活对象,随后进入混合收集阶段。此时不会对所有老年代区域进行回收,而是根据暂停时间目标优先回收价值高(存活对象少)的区域(这也是 Gabage First 名称的由来)。
Mixed Collection (混合垃圾回收)
混合收集阶段中,参与复制的有 eden、survivor、old
复制完成,内存得到释放。进入下一轮的新生代回收、并发标记、混合收集
总结
在jvm中,实现了多种垃圾收集器,包括:
- 串行垃圾收集器:Serial GC、Serial Old GC
- 并行垃圾收集器:Parallel Old GC、ParNew GC
- CMS(并发)垃圾收集器:CMS GC,作用在老年代
- G1垃圾收集器,作用在新生代和老年代
强引用、软引用、弱引用、虚引用的区别
- 强引用
- 只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收
- 只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收
- 软引用
- 仅有软引用引用该对象时,在垃圾回收后,内存
仍
不足时会再次触发垃圾回收
- 仅有软引用引用该对象时,在垃圾回收后,内存
- 弱引用:
- 仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
- 虚引用:
- 必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放
直接内存
- 必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放
总结
- 强引用:只要所有 GC Roots 能找到,就不会被回收
- 软引用:需要配合SoftReference使用,当垃圾多次回收,内存依然不够的时候会回收软引用对象
- 弱引用:需要配合WeakReference使用,只要进行了垃圾回收,就会把弱引用对象回收
- 虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存
JVM实践
JVM调优的参数可以在哪里设置
- war包部署在tomcat中设置
- jar包部署在启动参数设置
war包设置
jar包设置
JVM调优的参数都有哪些
对于JVM调优,主要就是调整年轻代、老年代、元空间的内存空间大小及使用的垃圾回收器类型。
https://www.oracle.com/java/technologies/javase/vmoptions-jsp.html
- 设置堆空间大小
- 虚拟机栈的设置
- 年轻代中Eden区和两个Survivor区的大小比例
- 年轻代晋升老年代阈值
- 设置垃圾回收收集器
设置堆空间大小
设置堆的初始大小和最大大小,为了防止垃圾收集器在初始大小、最大大小之间收缩堆而产生额外的时间,通常把最大、初始大小设置为
相同
的值。
虚拟机栈的设置
虚拟机栈的设置:
每个线程默认会开启1M的内存
,用于存放栈帧、调用参数、局部变量等,但一般256K就够用。通常减少每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统。
年轻代中Eden区和两个Survivor区的大小比例
设置年轻代中Eden区和两个Survivor区的大小比例。该值如果不设置,则默认比例为8:1:1。通过增大Eden区的大小,来减少YGC发生的次数,但有时我们发现,虽然次数减少了,但Eden区满的时候,由于占用的空间较大,导致释放缓慢,此时STW的时间较长,因此需要按照程序情况去调优。
年轻代晋升老年代阈值
设置垃圾回收收集器
通过增大吞吐量提高系统性能,可以通过设置并行垃圾回收收集器。
说一下JVM调优的工具
- 命令工具
- jps 进程状态信息
- jstack 查看java进程内线程的堆栈信息
- jmap 查看堆转信息
- jhat 堆转储快照分析工具
- jstat JVM统计监测工具
- 可视化工具
- jconsole 用于对jvm的内存,线程,类 的监控
- VisualVM 能够监控线程,内存情况
jps
进程状态信息
jstack
查看java进程内线程的堆栈信息
jmap
用于生成堆转内存快照、内存使用情况
jstat
是JVM统计监测工具。可以用来显示垃圾回收信息、类加载信息、新生代统计信息等
jconsole
用于对jvm的内存,线程,类 的监控,是一个基于 jmx 的 GUI 性能监控工具
打开方式:java 安装目录 bin目录下 直接启动 jconsole.exe 就行
VisualVm
能够监控线程,内存情况,查看方法的CPU时间和内存中的对 象,已被GC的对象,反向查看分配的堆栈
打开方式:java 安装目录 bin目录下 直接启动 jvisualvm.exe就行
Java内存泄漏的排查思路
- 获取堆内存快照dump
- VisualVM去分析dump文件
- 通过查看堆信息的情况,定位内存溢出问题
(一). 通过jmap指定打印他的内存快照dump(Dump文件是进程的内存镜像。可以把程序的执行状态通过调试器保存到dump文件中)
(二).通过工具, VisualVM去分析dump文件,VisualVM可以加载离线的dump文件
(三).通过查看堆信息的情况,可以大概定位内存溢出是哪行代码出了问题
(四).找到对应的代码,通过阅读上下文的情况,进行修复即可
CPU飙高排查方案与思路
-
使用top命令查看占用cpu的情况
-
通过top命令查看后,可以查看是哪一个进程占用cpu较高,上图所示的进程为:40940
-
查看进程中的线程信息
ps H -eo pid,tid,%cpu | grep 40940
4. 可以根据线程 id 找到有问题的线程,进一步定位到问题代码的源码行号