JVM
JVM组成
JVM是什么
Java Virtual Machine:Java程序的运行环境(java二进制字节码的运行环境)
好处:一次编写,到处运行;自动内存管理,垃圾回收机制
JVM由哪些部分组成,运行流程是什么?
什么是程序计数器
程序计数器:线程私有的,内部保存的字节码的行号。用于记录正在执行的字节码指令的地址。
Java堆
①线程共享的区域:主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError
异常。
②组成:年轻代+老年代
年轻代被划分为三部分,Eden区和两个大小严格相同的Survivor区老年代主要保存生命周期长的对象,一般是一些老的对象
③Jdk1.7和1.8的区别
1.7中有一个永久代,存储的是类信息、静态变量、常量、编译后的代码;1.8移除了永久代,把数据存储到了本地内存的元空间中,防止内存溢出
虚拟机栈
Java Virtual machine Stacks (java虚拟机栈)
- 每个线程运行时所需要的内存,称为虚拟机栈,先进后出
- 每个栈由多个栈帧(frame)组成,对应着每次方法调用时所占用的内存
- 每个线程只能有一个活动栈桢,对应着当前正在执行的那个方法
①垃圾回收是否涉及栈内存?
垃圾回收主要指就是堆内存,当栈帧弹栈以后,内存就会释放
②栈内存分配越大越好吗?
未必,默认的栈内存通常为1024k
栈帧过大会导致线程数变少,例如,机器总内存为512m,目前能活动的线程数则为512个,如果把栈内存改为2048k,那么能活动的栈帧就会减半
③方法内的局部变量是否线程安全?
如果方法内局部变量没有逃离方法的作用范围,它是线程安全的
如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
public static void main(String[] args) {
StringBuilder sb = new StringBuilder();
sb.append(1);
sb.append(2);
new Thread(() -> {
m2(sb);
}).start();
}
// 线程安全
public static void m1() {
StringBuilder sb = new StringBuilder();
sb.append(1);
sb.append(2);
system.out.println(sb.toString());
}
// 线程不安全
public static void m2(StringBuilder sb) {
sb.append(3);
sb.append(4);
System.out.println(sb.toString());
}
// 线程不安全
public static StringBuilder m3() {
StringBuilder sb = new StringBuilder();
sb.append(5);
sb.append(6);
return sb;
}
④栈内存溢出情况
-
栈帧过多导致栈内存溢出,典型问题:递归调用
-
栈帧过大导致栈内存溢出
// java.lang.StackOverflowError
public static void m4(){
m4();
}
⑤堆栈的区别是什么?
-
栈内存一般会用来存储局部变量和方法调用,但堆内存是用来存储Java对象和数组的。堆会GC垃圾回收,而栈不会。
-
栈内存是线程私有的,而堆内存是线程共有的。
-
两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。
栈空间不足:
java.lang.StackOverFlowError
。
堆空间不足:java.lang.OutOfMemoryError
。
方法区
- 方法区(Method Area)是各个线程共享的内存区域主要存储类的信息、运行时常量池
- 虚拟机启动的时候创建,关闭虚拟机时释放
- 如果方法区域中的内存无法满足分配请求,则会抛出
OutOfMemoryError: Metaspace
常量池
可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
javap -v Application.class
查看字节码结构(类的基本信息、常量池、方法定义)
运行时常量池
常量池是*.class
文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
直接内存
直接内存:并不属于JVM中的内存结构,不由JVM进行管理。是虚拟机的系统内存;常见于NIO操作时,用于数据缓冲区,它分配回收成本较高,但读写性能高,不受JVM内存回收管理
举例:Java代码完成文件拷贝
常规IO的数据拷贝流程
NIO数据拷贝流程
类加载器
什么是类加载器,类加载器有哪些
类加载器
JVM只会运行二进制文件,类加载器的作用就是将字节码文件加载到JVM中,从而让Java程序能够启动起来。
双亲委派模型
加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,子加载器尝试加载该类
①JVM为什么采用双亲委派机制?
- 通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性
- 为了安全,保证类库API不会被修改
类装载的执行过程
类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备和解析这三个部分统称为连接(linking)
①加载
- 通过类的全名,获取类的二进制数据流
- 解析类的二进制数据流为方法区内的数据结构(Java类模型)
- 创建
java.lang.Class
类的实例,表示该类型。作为方法区这个类的各种数据的访问入口
②验证
验证类是否符合JVM规范,安全性检查
- 文件格式验证
- 元数据验证
- 字节码验证
- 符号引用验证Class文件在其常量池会通过字符串记录自己将要使用的其他类或者方法,检查它们是否存在
前三点主要检查格式,如:文件格式是否错误、语法是否错误、字节码是否合规
③准备
为类变量分配内存并设置类变量初始值
- static变量,分配空间在准备阶段完成(设置默认值),赋值在初始化阶段完成
- static变量是final的基本类型,以及字符串常量,值已确定,赋值在准备阶段完成
- static变量是final的引用类型,那么赋值也会在初始化阶段完成
public class Application {
// 准备阶段设置为默认值0,初始化阶段赋值为10
static int b = 10;
// 准备阶段完成赋值
static final int c= 20;
static final String d ="hello";
// 初始化阶段完成赋值
static final Object obj = new Object();
}
④解析
把类中的符号引用转换为直接引用
比如:方法中调用了其他方法,方法名可以理解为符号引用,而直接引用就是使用指针直接指向方法。
⑤初始化
对类的静态变量,静态代码块执行初始化操作
- 如果初始化一个类的时候,其父类尚未初始化,则优先初始化其父类
- 如果同时包含多个静态变量和静态代码块,则按照自上而下的顺序依次执行
- 子类调用父类的静态变量,只会触发父类初始化
⑥使用
JVM开始从入口方法执行用户的程序代码
- 调用静态类成员信息(比如:静态字段、静态方法)
- 使用new关键字为其创建对象实例
⑦卸载
当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象
垃圾回收
对象什么时候被垃圾回收器回收
简单一句就是:如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收。
如果要定位什么是垃圾,有两种方式来确定,第一个是引用计数法,第二个是可达性分析算法
①引用计数法
一个对象被引用了一次,在当前的对象头上递增一次引用次数,如果这个对象的引用次数为0,代表这个对象可回收。
当对象间出现了循环引用的话,则引用计数法就会失效。
②可达性分析算法
现在的虚拟机采用的都是通过可达性分析算法来确定哪些内容是垃圾
X,Y这两个节点是可回收的
Java虚拟机中的垃圾回收器采用可达性分析来探索所有存活的对象
扫描堆中的对象,看是否能够沿着GC Root
对象为起点的引用链找到该对象,找不到,表示可以回收
③哪些对象可以作为GC Root
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
public static void main(String args){
// demo可以作为 GC Root
Demo demo = new Demo();
demo = null;
}
- 方法区中类静态属性引用的对象
// a可以作为 GC Root
public static Demo a;
public static void main(String args){
Demo b = new Demo();
b.a = new Demo();
b = null;
}
- 方法区中常量引用的对象
// a可以作为 GC Root
public static final Demo a = new Demo();
public static void main(Stringargs){
Demo demo = new Demo();
demo = null;
}
- 本地方法栈中JNI(即一般说的Native方法)引用的对象
JVM垃圾回收算法
①标记清除算法
标记清除算法,是将垃圾回收分为2个阶段,分别是标记和清除。
- 根据可达性分析算法得出的垃圾进行标记
- 对这些标记为可回收的内容进行垃圾回收
优点:标记和清除速度较快
缺点:碎片化较为严重,内存不连贯的
②标记整理算法
优缺点同标记清除算法,解决了标记清除算法的碎片化的问题,同时,标记压缩算法多了一步,对象移动内存位置的步骤,其效率也有一定的影响。
③复制算法
优点:在垃圾对象多的情况下,效率较高;清理后,内存无碎片
缺点:分配的2块内存空间,在同一个时刻,只能使用一半,内存使用率较低
JVM中分代垃圾回收
①在java8时,堆被分为了两份:新生代和老年代【1:2】
对于新生代,内部又被分为了三个区域:
- 伊甸园区Eden,新生的对象都分配到这里
- 幸存者区survivor(分成from和to)
- Eden区,from区,to区【8:1:1】
②工作机制
- 新创建的对象,都会先分配到eden区
- 当伊甸园内存不足,标记伊甸园与from(现阶段没有)的存活对象
- 将存活对象采用复制算法复制到to中,复制完毕后,伊甸园和from内存都得到释放
- 经过一段时间后伊甸园的内存又出现不足,标记eden区域to区存活的对象,将存活的对象复制到from区
- 当幸存区对象熬过几次回收(最多15次),晋升到老年代(幸存区内存不足或大对象会导致提前晋升)
③MinorGC、Mixed GC .FullGC的区别是什么
- MinorGC 【young GC】发生在新生代的垃圾回收,暂停时间短(STW)
- Mixed GC:新生代+老年代部分区域的垃圾回收,G1收集器特有
- FullGC:新生代+老年代完整垃圾回收,暂停时间长(STW),应尽力避免
名词解释
STW (Stop-The-World):暂停所有应用程序线程,等待垃圾回收的完成
JVM中垃圾回收器
在jvm中,实现了多种垃圾收集器,包括:
①串行垃圾收集器
Serial和Serial Old串行垃圾收集器,是指使用单线程进行垃圾回收,堆内存较小,适合个人电脑
- Serial 作用于新生代,采用复制算法
- Serial Old 作用于老年代,采用标记-整理算法
垃圾回收时,只有一个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
②并行垃圾收集器
Parallel New和Parallel Old是一个并行垃圾回收器,JDK8默认使用此垃圾回收器
- Parallel New作用于新生代,采用复制算法
- Parallel Old作用于老年代,采用标记-整理算法
垃圾回收时,多个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
③CMS(并发)垃圾收集器
CMS全称Concurrent Mark Sweep,是一款并发的、使用标记-清除算法的垃圾回收器,该回收器是针对老年代垃圾回收的,是一款以获取最短回收停顿时间为目标的收集器,停顿时间短,用户体验就好。其最大特点是在进行垃圾回收时,应用仍然能正常运行。
④G1垃圾收集器
- 应用于新生代和老年代,在JDK9之后默认使用G1
- 划分成多个区域,每个区域都可以充当eden,survivor,old,humongous,其中humongous专为大对象准备
- 采用复制算法
- 响应时间与吞吐量兼顾
- 分成三个阶段:新生代回收(stw)、并发标记(重新标记stw)、混合收集
- 如果并发失败(即回收速度赶不上创建新对象速度),会触发Full GC
强引用、软引用、弱引用、虚引用的区别
- 强引用:只要所有GC Roots能找到,就不会被回收
- 软引用:需要配合SoftReference使用,当垃圾多次回收,内存依然不够的时候会回收软引用对象
- 弱引用:需要配合WeakReference使用,只要进行了垃圾回收,就会把弱引用对象回收(ThreadLocal的内存泄露问题)
- 虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由Reference Handler线程调用虚引用相关方法释放直接内存
JVM实战
JVM调优的参数可以在哪里设置参数值
- war包部署在tomcat中设置
修改TOMCAT_HOME/bin/catalina.sh文件
# 0s specific support. Svar must be set to either true or false.
JAVA_OPTS="-Xms512m -Xmx1024m"
-
jar包部署在启动参数设置
通常在linux系统下直接加参数启动springboot项目# nohup :用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行参数 # &︰让命令在后台执行,终端退出后命令仍旧执行。 nohup java -Xms512m -Xmx1024m -jar xxxx.jar --spring.profiles.active=prod &
JVM调优的参数
对于JVM调优,主要就是调整年轻代、老年代、元空间的内存空间大小及使用的垃圾回收器类型。
官网地址:https://www.oracle.com/java/technologies/javase/vmoptions-jsp.html
- 设置堆空间大小
设置堆的初始大小和最大大小,为了防止垃圾收集器在初始大小、最大大小之间收缩堆而产生额外的时间,通常把最大、初始大小设置为相同的值。
-Xms:设置堆的初始化大小
-Xmx:设置堆的最大大小
# 不指定单位默认为字节
-Xms:1024
# 指定单位,按照指定的单位设置
-Xms:1024k
-Xms:1024m
-Xms:1g
堆空间设置多少合适?
- 最大大小的默认值是物理内存的
1/4
,初始大小是物理内存的1/64
- 堆太小,可能会频繁的导致年轻代和老年代的垃圾回收,会产生
stw
,暂停用户线程 - 堆内存大肯定是好的,存在风险,假如发生了
fullgc
,它会扫描整个堆空间,暂停用户线程的时间长 - 设置参考推荐:尽量大,也要考察一下当前计算机其他程序的内存使用情况
- 虚拟机栈的设置
每个线程默认会开启1M的内存,用于存放栈帧、调用参数、局部变量等,但一般256K就够用。通常减少每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统。
# -Xss 对每个线程stack大小的调整
-Xss128k
- 年轻代中Eden区和两个Survivor区的大小比例
该值如果不设置,则默认比例为8:1:1
。通过增大Eden
区的大小,来减少YGC
发生的次数,但有时我们发现,虽然次数减少了,但Eden
区满的时候,由于占用的空间较大,导致释放缓慢,此时STW
的时间较长,因此需要按照程序情况去调优。
# 表示年轻代中的分配比率:survivor:eden = 2:8
-XX:SurvivorRatio=8
- 年轻代晋升老年代阈值
# 默认为15,取值范围0-15
-XX:MaxTenuringThreshold=threshold
- 设置垃圾回收收集器
# 增大吞吐量提高系统性能,可以通过设置并行垃圾回收收集器。
-XX:+UseParallelGC
-XX:+UseParallelOldGc
-XX:+UseG1GC
JVM调优的工具
-
命令工具
①jps:进程状态信息
②jstack:查看java进程内线程的堆栈信息
jps jstack [option] <pid>
③jmap:查看堆信息
# 显示Java堆的信息 jmap -heap pid # format=b表示以hprof二进制格式转储Java堆的内存;file=<filename>用于指定快照dump文件的文件名。 jmap -dump:format=b,file=heap.hprof pid
④jhat:堆转储快照分析工具
⑤jstat:JVM统计监测工具
# 总结垃圾回收统计 jstat -gcutil pid # 垃圾回收统计 jstat -gc pid
-
可视化工具
①jconsole:用于对jvm的内存,线程,类的监控
②VisualVM(JDK8中有,高版本就没有了):能够监控线程,内存情况
java内存泄露的排查思路
- 获取堆内存快照dump
通过jmap指定打印他的内存快照dump(Dump文件是进程的内存镜像。可以把程序的执行状态通过调试器保存到dump文件中)
# 使用jmap命令获取运行中程序的dump文件
jmap -dump:format=b,file=heap.hprof pid
# 使用vm参数获取dump文件
# 有的情况是内存溢出之后程序则会直接中断,而jmap只能打印在运行中的程序,所以建议通过参数的方式的生成dump文件
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=/home/app/dumps/
- VisualVM去分析dump文件
- 通过查看堆信息的情况,定位内存溢出问题
CPU飙高的排查思路及方案
# 查看cpu高的pid
top
# 查看该pid下所有的线程id及所占cpu比例
ps H -eo pid,tid,%cpu | grep pid
# 查询所有线程的具体信息
jstack pid
# 获取十六进制id
printf "%x\n" tid
# -A向下查询30行日志,-C是上下30行
jstack pid|grep -A 30 十六进制的tid