JVM是什么?
JVM(Java Virtual Machine):java程序的运行环境(java二进制字节码的运行环境)。
好处:
- 一次编写,到处运行
- 自动内存管理,垃圾回收机制
什么是程序计数器
程序计数器:线程私有的,内部保存的字节码行号。用于记录正在执行的字节码指令的地址。
你能详细地介绍一下java堆吗?
- Java堆是线程共享的区域:主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError异常。
- java堆的组成:年轻代+老年代
- 年轻代被划分为三部分:Eden区和两个大小严格相同的Survivor区
- 老年代主要保存生命周期长的对象,一般是一些老的对象
jdk 1.7和1.8的区别:
- 1.7中有一个永久代,存储的是类信息,静态变量、常量、编译后的代码
- 1.8中移除了永久代,将数据存储到了本地内存的元空间中,防止内存溢出。
本地方法栈:存储C++ native方法(线程私有
)
程序计数器:线程私有的,内部保存的字节码行号。用于记录正在执行的字节码指令的地址。(线程私有
)
虚拟机栈:存储函数运行过程中的临时变量(线程私有
)
方法区、元空间:保存类信息、静态变量、常量、编译后的代码(全局共享
)
堆区:主要用来保存对象实例,数组等(全局共享
)
什么是虚拟机栈
虚拟机栈(Java Virtual machine Stacks)
特点:
每个线程运行时所需要的内存,称为虚拟机栈,先进后出
每个栈由多个栈帧组成,对应着每次方法调用时所占用的内存。栈帧记录着参数、局部变量、返回地址等。
每个线程只能有一个活动栈帧
,对应着当前正在执行的那个方法。
垃圾回收是否涉及栈内存?
垃圾回收主要指的就是堆内存,当栈帧弹栈以后,内存就会自动释放。
栈内存分配越大越好吗?
未必,默认的栈内存通常是1024K
栈帧过大会导致线程数变少,例如,机器总内存为512M,目前能活动的线程数为512个,如果把栈内存改为2048K,那么活动的栈帧就会减半。
方法内的局部变量是否线程安全?
需要分情况讨论:
- 如果方法内的局部变量没有逃离方法的作用范围,则它是线程安全的;
- 如果局部变量引用了对象,并逃离方法的作用范围,则可能是线程不安全的,需要考虑线程安全问题。
栈内存溢出情况?
- 栈帧过多导致栈内存溢出,典型问题:递归调用(java.lang.StackOverflowError)
- 栈帧过大导致栈内存溢出
堆和栈的区别?
- 栈内存一般会用来存放局部变量和方法调用,但是堆内存是用来存储java对象和数组的。
- 堆会GC垃圾回收,而栈不会。
- 栈内存是线程私有的,而堆内存是线程共有的。
- 两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。
- 栈空间不足:java.lang.StackOverFlowError
- 堆空间不足:java.lang.OutOfMemoryError
能不能解释一下方法区/元空间?
- 方法区(Method Area)是各个线程共享的内存区域。
- 主要存储类的信息(Class、Classloader)、运行时常量池。
- 虚拟机启动时创建,关闭虚拟机时释放。
- 如果方法区中的内存无法满足分配请求,则会抛出OutOfMemoryError:Metaspace
常量池:可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、类型参数、字面变量等信息(机器指令要去常量池中查表翻译)
运行时常量池:常量池是*.class文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址。
你听过直接内存吗?
- 直接内存:并不属于JVM中的内存结构,也不由JVM进行管理。是虚拟机的系统内存
- 常见于NIO操作时,用于数据缓冲区,它分配回收成本较高,但读写性能高,不受JVM内存回收管理。
补充:
- 常规的IO数据拷贝流程
- NIO数据拷贝流程
什么是类加载器,类加载器有哪些?
JVM只会运行二进制文件,类加载器的作用就是将字节码加载到JVM中,从而让Java程序启动。
类加载器的种类如下:
什么是双亲委派机制?
加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,子加载器尝试加载该类。
JVM为什么采用双亲委派机制?
- 通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性。
- 为了安全,保证类库API不会被修改。
说一下类装载的执行过程?
类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备和解析这三个部分统称为连接(linking)
- 加载:查找和导入class文件
- 通过类的全名,获取类的二进制数据流;
- 解析类的二进制数据流为方法区的数据结构(java类模型)
- 创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口。
- 验证(检验类是否符合JVM的规范,安全性检查),保证加载类的准确性。
- 文件格式检查
- 元数据验证
- 字节码验证
- 符号引用验证:Class文件在其常量池中通过字符串记录自己将要使用的其他类或方法,检查它们是否存在。
- 准备:为类变量(static变量)分配内存并设置类变量初始值
- static变量,分配空间在准备阶段完成(设置默认值),赋值在初始化阶段完成。
- 若static变量是final的基本类型,以及字符串常量,值已确定,赋值在准备阶段完成
- 若static变量是final的引用类型,那么赋值也会在初始化阶段完成。
- 解析:把类中的符号引用转化为直接引用
比如:方法中调用了其他方法,方法名可以理解为符号引用,而直接引用就是使用指针直接指向方法。
- 初始化(对类的静态变量以及静态代码块执行初始化操作)
- 如果初始化一个类的时候,其父类尚未初始化,则优先初始化父类
- 如果同时包含多个静态变量和静态代码块,则按照自上而下的顺序依次执行。
- 使用(JVM开始从入口开始执行用户的程序代码)
- 调用静态类成员信息(比如:静态字段、静态方法)
- 使用new关键字为其创建对象实例
7.卸载:当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象。
对象什么时候可以被垃圾器回收
垃圾回收主要指的是堆(Java堆是线程共享的区域:主要用来保存对象实例,数组等)中区域。
简单总结就是:如果一个或者多个对象没有任何的引用指向它了,那么这个对象就成为了垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收。
如何定位垃圾
如果要定位垃圾,有两种方式来确定,第一个是引用计数法
,第二个是可达性分析算法
。
引用计数法
一个对象被引用了一次,在当前的对象头上递增一次引用次数,如果这个对象的引用次数为0,代表这个对象可回收。
但是当对象间出现了循环引用的话,引用计数法就会失效。(会引发内存泄漏问题)
举例如下:
可达性分析算法
现在的虚拟机采用的都是可达性分析算法来确定哪些内容是垃圾
哪些对象可以作为GC Root呢?
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈(Nactive方法)中引用的对象。
JVM垃圾回收算法有哪些?
- 标记清除算法
- 复制算法
- 标记整理算法
标记清除算法
将垃圾回收器分为了2个阶段,分别是标记和删除
1.根据可达性分析算法得出的垃圾进行标记
2.对这些标记为可回收的内容进行垃圾回收
优点:标记和清除速度较快
缺点:碎片化较为严重,导致内存不连贯
标记整理算法
标记整理算法在标记清除算法的基础上多了一步,增加了将存活对象移动内存位置的步骤,其效率也有一定的影响。
注:很多老年代的垃圾回收器会使用垃圾回收算法。
复制算法
将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将内存空间清空,交换两个内存的角色,完成垃圾的回收。
一般年轻代垃圾回收器会选择使用复制算法。
优点:
- 在垃圾对象多的情况下,效率较高
- 清理后,内存无碎片
缺点: - 需要分配2块内存空间,在同一个时刻,只能使用一半,内存使用率较低
说一下JVM中的分代回收
堆的区域划分
在java8中,堆被分为了两份:新生代和老年代(1:2)
对于新生代,内部又被分为了三个区域
- 伊甸园区Eden,新生的对象都分配到这里
- 幸存者区Survivor(分成from和to)
- Eden区,from区和to区的比例【8:1:1】
分代回收的工作机制
- 新创建的对象,都会先分配到eden区域中
- 当伊甸园区内存不足,标记伊甸园区与from的存活对象
将存活对象采用复制算法复制到to中,复制完毕后,伊甸园区和from区内存都得到释放
经过一段时间后伊甸园区的内存又出现不足,标记eden区以及to区存活的对象复制到from区
当幸存对象熬过回收的阈值(15次),就会晋升到老年代
如果幸存区内存不足或者大对象会导致提前晋升。
MinorGC、Mixed GC、FullGC的区别是什么?
- MinorGC【Young GC】发生在新生代的垃圾回收,暂停时间短(STW)
STW(Stop-The-World):暂停所有应用程序线程,等待垃圾回收完成
- Mixed GC:新生代+老年代部分区域的垃圾回收,G1收集器持有
- FullGC:新生代+老年代完整垃圾回收,暂停时间长(STW),应该尽力避免(发生在新生代和老年代内存严重不足时)
说一下JVM有哪些垃圾回收器?
- 串行垃圾收集器
- 并行垃圾收集器
- CMS(并发)垃圾收集器
- G1垃圾收集器:作用在新生代和老年代
串行垃圾收集器
Serial和Serial Old串行垃圾收集器,是指使用单线程进行垃圾回收,堆内存较小,适合个人电脑。
Serial作用于新生代,采用复制算法
Serial Old作用于老年代,采用标记-整理算法
垃圾回收时,只有一个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
并行垃圾收集器
Paraller New和Paraller Old是一个并行垃圾回收器,JDK8默认使用此垃圾回收器
Paraller New作用于新生代,采用复制算法
Paraller Old作用于老年代,采用标记整理算法
垃圾回收时,多个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
CMS垃圾回收器
CMS全称Concurrent Mark Sweep,是一款并发的、使用标记-清除算法进行回收的垃圾回收器,该回收器是针对老年代垃圾回收的,是一款以获取最短回收停顿时间为目标的收集器,停顿时间短,用户体验就好。其最大特点是在进行垃圾回收时,应用仍然能够正常运行。
详细聊一下G1垃圾回收器
- 应用在新生代和老年代,在JDK9之后默认使用G1
- 划分成多个区域,每个区域都可以当成eden,survivor,old,humongous,其中humongous专为大对象准备
- 采用复制算法
- 响应时间与吞吐量兼顾
- 分成三个阶段:新生代回收(STW)、并发标记(重新标记STW)、混合收集
- 如果并发失败(即回收速度赶不上创建新对象的速度),会触发Full GC
Young Collection(年轻代垃圾回收)
- 初始时,所有区域都处于空闲状态
- 创建了一些对象,挑出一些空闲区域作为伊甸园区存储对象
- 当伊甸园区需要垃圾回收时,挑出一个空闲区域作为幸存区,用复制算法复制存活对象,需要暂停用户线程
- 随着时间的流逝,伊甸园的内存又有不足
- 将伊甸园以及之前的幸存区中的存活对象,采用复制算法,复制到新的幸存区,其中较老的对象升级为老年代
Young Collection + Concurrent Mark(年轻代垃圾回收+并发标记)
- 当老年代占用内存超过阈值(默认是45%)后,触发并发标记,这时无需暂停用户线程
- 并发标记之后,会有重新标记阶段解决漏标问题,此时需要暂停用户线程。
- 这些都完成后就知道了老年代有哪些存活对象,随后进入混合收集阶段。此时不会对所有老年代区域进行回收,而是根据暂停时间目标优先回收价值高(存活对象少)的区域。(这也是G1名称的由来)
Mixed Collection(混合垃圾回收)
混合收集阶段中,参与复制的有eden、survivor、old
复制完成,内存得到释放。进入下一轮的新生代回收、并发标记、混合收集。
强引用、软引用、弱引用和虚引用的区别
- 强引用:只有所有GC Roots对象都不通过【强引用】引用该对象,该对象才能被垃圾回收
User user = new User();
- 软引用:仅有软引用引用该对象时,在垃圾回收后,内存仍不足会再次触发垃圾回收
User user = new User();
SoftReference softReference = new SoftReference(user);
- 弱引用:仅有软引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
User user = new User();
WeakReference WeakReference = new WeakReference(user);
弱引用涉及到ThreadLocal的内存泄露问题,参见多线程面试题。
- 虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由Reference Handler线程调用虚引用相关方法释放直接内存。
User user = new User();
ReferenceQueue ReferenceQueue = new ReferenceQueue(user);
PhantomReference phantomReference = new PhantomReference(user,queue);
JVM调优的参数在哪里可以设置?
- war包部署在tomcat中设置
修改TOMCAT_HOME/bin/catalina.sh文件(Linux) - jar包部署在启动参数设置
java -Xms512m -Xmx1024m -jar xxxx.jar
JVM调优的参数都有哪些?
对于JVM调优,主要就是调整年轻代、老年代、元空间的内存空间大小及使用的垃圾回收器类型。
下面进行举例说明:
-
设置堆空间的大小:为了防止垃圾收集器在初始化大小、最大大小之间收缩堆而产生额外的时间,通常设置为相同的值。
-Xms:1024 设置堆的初始化大小(不指定单位默认字节)
-Xmx:1024 设置堆的最大大小
设置多少合适呢?- 最大大小默认是物理内存的1/4,初始化大小是物理内存的1/64
- 堆太小,可能会频繁地导致年轻代和老年代的垃圾回收,会产生stw,暂停用户线程
堆内存大相对来说比较好,但是也存在风险,假如发生了fullgc,它会扫描整个堆空间,暂停用户线程的时间长 - 设置参考推荐:尽量大,但是也要参考当前计算机其他程序的内存使用情况
-
虚拟机栈的设置:每个线程默认会开启1M的内存,用于存放栈帧、调用参数、局部变量等,但一般256K就够用。通常减少每个线程的堆栈,可以产生更多的线程,但实际上还受限于操作系统
-Xss 对每个线程stack大小的调整,-Xss 128k
-
年轻代中Eden区和两个Survivor区的大小比例:默认是8:1:1。通过增大Eden区的大小来减少YGC发生的次数,但有时我们发现,虽然次数减少了,但Eden区满的时候,由于占用的空间较大,导致释放较慢,此时STW的时间较长。
-XXSurvivorRatio=8,表示年轻代中的分配比率:survivor : eden=2 : 8
-
年轻代晋升老年代阈值
-XX: MaxTenuringThreshold=threshold
- 默认为15,取值范围为0-15
-
设置垃圾回收收集器
通过增大吞吐量提高系统性能,可以通过设置并行垃圾回收收集器
-XX: +UseParallerGC
-XX: +UseParallerOldGC
-XX: +UseG1GC
Java内存泄露的排查思路?
内存泄漏(Memory Leak)是指程序中已动态分配的堆内存由于某种原因程序未释放或无法被回收,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果。
- 通过jmap或设置jvm参数获取堆内存快照dump
- VisualVM去分析dump文件
- 通过查看堆信息的情况,定位内存溢出问题
CPU飚高的排查方案与思路?
- 使用top命令查看占用cpu的情况
- 通过top命令,可以查看哪一个进程占用cpu较高
- 查看进程中的线程信息:使用ps命令
- 可以根据线程id找到有问题的线程,进一步定位问题代码的源码代号
jstack 进程id