JVM虚拟机篇
JVM介绍、运行流程
面试官: JVM由那些部分组成,运行流程是什么?
候选人:
嗯,好的~~
在JVM中共有四大部分,分别是ClassLoader(类加载器)、Runtime Data Area(运行时数据区,内存分区)、Execution Engine(执行引擎)、Native Method Library(本地库接口)
它们的运行流程是:
第一,类加载器把Java代码转换为字节码
第二,运行时数据区把字节码加载到内存中,而字节码文件只是JVM的一套指令集规范,并不能直接交给底层系统去执行,而是由执行引擎运行
第三,执行引擎将字节码翻译为底层系统指令,再交由CPU去执行,此时需要调用其他语言的本地库接口来实现整个程序的功能。
面试官: 好的,你能详细说一下JVM运行时数据区吗?
候选人:
嗯,好~
运行时数据区包含了堆、方法区、栈、本地方法栈、程序计数器这几部分,每个功能作用不一样。
- 堆解决的是对象实例存储的问题,垃圾回收器管理的主要区域。
- 方法区可以认为是堆的一部分,用于存储已被虚拟机加载的信息,常量、静态变量、即时编译器编译后的代码。
- 栈解决的是程序运行的问题,栈里面存的是栈帧,栈帧里面存的是局部变量表、操作数栈、动态链接、方法出口等信息。
- 本地方法栈与栈功能相同,本地方法栈执行的是本地方法,一个Java调用非Java代码的接口。
- 程序计数器(PC寄存器)中存放的是当前线程所执行的字节码的行数。JVM工作时就是通过改变这个计数器的值来选取下一个需要执行的字节码指令。
JVM组成
什么是程序计数器
面试官: 好的,你再详细介绍一下程序计数器的作用?
候选人:
嗯,是这样的~~
Java虚拟机对于多线程是通过线程轮流切换并且分配线程执行时间。在任何的一个时间点上,一个处理器只会处理执行一个线程,如果当前被执行的这个线程它所分匹配的执行时间用完了【挂起】。处理器会切换到另外的一个线程上来进行执行。并且这个线程的执行时间用完了,接着处理器就会又来执行被挂起的这个线程。这时候程序计数器就起到了关键作用,程序计数器在来回切换的线程中记录它上一次执行的行号,然后接着继续向下执行。
你能给我详细地介绍下堆吗
面试官: 你能给我详细地介绍Java堆吗?
候选人:
好的~
Java中的堆属于线程共享的区域。主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError异常。
在Java8中堆内会存在年轻代、老年代
- Young区被划分为三部分,Eden区和两个大小严格相等的Survivor区,其中,Survivor区间中,某一时刻只有其中一个是被使用的,另外一个留作垃圾收集时复制对象用。在Eden区变满的时候,GC就会将存活的对象移动到空闲的Survivor区间中,根据JVM的策略,在经过几次垃圾回收后,任然存活于Survivor的对象将被移动到Tenured区间。
- Tenured区主要保存生命周期长的对象,一般是一些老的对象,当一些对象在Young复制转移一定的次数以后,对象就会被转移到Tenured区
面试官: jdk1.7和1.8的区别?
候选人:
- 1.7中有一个永久代,存储的是类信息、静态变量、常量、编译后的代码
- 1.8移出了永久代,把数据存储到了本地内存的元空间中,防止内存溢出
什么是虚拟机栈
面试官: 什么是虚拟机栈?
候选人:
虚拟机栈描述的是方法执行时的内存模型,是线程私有的,生命周期与线程相同,每个方法被执行的同时会创建栈帧。保存执行方法时的局部变量、动态连接信息、方法返回地址信息等等。方法开始执行的时候会进栈,方法执行完会出栈【相当于清空了数据】,所以这块区域不需要进行GC。
面试官: 能说一下堆栈的区别是什么吗?
候选人:
嗯,好的,有这几个区别
第一,栈内存一般会用来存储局部变量和方法调用,但堆内存是用来存储Java对象和数组的。堆会GC垃圾回收,而栈不会。
第二、栈内存是线程私有的,而堆内存是线程共有的。
第三、两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常
栈空间不足:java.lang.StackOverFlowError。
堆空间不足:java.lang.OutOfMemoryError。
面试官: 垃圾回收是否涉及栈内存?
候选人:
垃圾回收主要指就是堆内存,当栈帧弹栈以后,内存就会释放
面试官: 栈内存分配越大越好吗?
候选人:
未必,默认的栈内存通常为1024k,栈帧过大会导致线程数变少
面试官: 方法内的局部变量是否线程安全?
候选人:
- 如果方法内局部变量没有逃离方法的作用范围,它是线程安全的
- 如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
面试官: 什么情况下会导致栈内存溢出?
候选人:
- 栈帧过多会导致栈内存溢出,典型问题:递归调用
- 栈帧过大导致内存溢出
能不能介绍一下方法区
面试官: 能不能解释一下方法区?
候选人:
好的~
- 方法区是各个线程共享的内存区域
- 主要存储类的信息、运行时常量池
- 虚拟机启动的时候创建,关闭虚拟机时释放
- 如果方法区域中的内存无法满足分配请求,则会抛出OutOfMemoryError:Metaspace
面试官: 介绍一下运行时常量池?
候选人:
- 常量池:可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
- 当类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
你听过直接内存吗
面试官: 你听过直接内存吗?
候选人:
嗯~
- 并不属于JVM中的内存结构,不由JVM进行管理。是虚拟机的系统内存
- 常见于NIO操作时,用于数据缓冲区,分配回收成本较高,但读写性能高,不受JVM内存回收管理
类加载器
什么是类加载器、什么是双亲委派
面试官: 什么是类加载器,类加载器有哪些?
候选人:
嗯,是这样的
JVM只会运行二进制文件,而类加载器(ClassLoader)的主要作用就是将字节码文件加载到JVM中,从而让Java程序能够启动起来。
常见的类加载器有4个
第一个是启动类加载器(BootStrap ClassLoader):其是由C++编写实现。用于加载JAVA_HOME/jre/lib目录下的类库。
第二个是扩展类加载器(ExtClassLoader):该类是ClassLoader的子类,主要加载JAVA_HOME/jre/lib/ext目录中的类库。
第三个是应用类加载器(AppClassLoader):该类是ClassLoader的子类,主要用于加载classPath下的类,也就是加载开发者自己编写的Java类。
第四个是自定义类加载器:开发者自定义类继承ClassLoader,实现自定义类加载规则。
面试官: 什么是双亲委派模型?
候选人:
嗯,它是这样的。
如果一个类加载器收到了类加载器的请求,它首先不会自己尝试加载这个类,而是把这请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传输到顶层的启动类加载器中,只有当父类加载器返回自己无法完成这个加载请求(它的搜索返回中没有找到所需的类)时,子类加载器才会尝试自己去加载
面试官: JVM为什么采用双亲委派机制?
候选人:
主要有两个原因。
第一、通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性。
第二、为了安全,保证类库API不会被修改
说一下类装载的执行过程
面试官: 说一下类装载的执行过程?
候选人:
嗯,这个过程还是挺多的。
类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备和解析这三个部分统称为连接(linking)
- 加载:查找和导入class文件
- 验证:保证类的准确性
- 准备:为类变量分配内存并设置类变量初始值
- 解析:把类中的符号引用转换为直接引用
- 初始化:对类的静态变量,静态代码块执行初始化操作
- 使用:JVM开始从入口方法开始执行用户的程序代码
- 卸载:当用户程序代码执行完毕以后,JVM便开始销毁创建的Class对象,最后负责运行的JVM也退出内存
垃圾回收
对象什么时候可以被垃圾器回收
面试官: 简述Java垃圾回收机制(GC是什么?为什么要GC)?
候选人:
嗯,是这样~~
为了让程序员更专注于代码的实现,而不用过多考虑内存释放的问题,所以,在Java语言中,有了自动的垃圾回收机制,也就是我们熟悉的GC(Garbage Collection)。
有了垃圾回收机制后,程序员只需要关心内存的申请即可,内存的释放由系统自动识别完成。
在进行垃圾回收时,不同的对象引用类型,GC会采用不同的回收时机。
面试官: 对象什么时候可以被垃圾器回收?
候选人:
思考一会~~
如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收。
如果要定位什么是垃圾,有两种方式来确定,第一个是引用计数法,第二个是可达性分析算法
通常都使用可达性分析算法来确定是不是垃圾
JVM垃圾回收算法有哪些
面试官: JVM垃圾回收算法有哪些?
候选人:
我记得一共有四种,分别是标记清除算法、复制算法、标记整理算法、分代回收
- 标记清除算法:垃圾回收分为2个阶段,分别是标记和清除,效率高,有磁盘碎片,内存不连续
- 标记整理算法:标记清除算法一样,将存活对象都向另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
- 复制算法:将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收;无碎片,内存使用率低
说一下JVM的分代回收
面试官: 你能详细聊一下分代回收吗?
候选人:
关于分代回收是这样的
在Java8时,堆被分为了两份:新生代和老年代,它们默认空间占用比例是1:2
对于新生代,内部又被分为了三个区域。Eden区,幸存者区survivor(分为from和to),默认空间占用比例是8:1:1
具体的工作机制是有些情况:
- 当创建一个对象的时候,那么这个对象就会被分配在新生代的Eden区。当Eden区要满了时候,触发YoungGC。
- 当进行YoungGC后,此时在Eden区存活的对象被移动到from区,并且当前对象的年龄会加1,清空Eden区。
- 当再一次触发YoungGC的时候,会把Eden区中存活下来的对象和from区中的对象,移动到to区中,这些对象的年龄会加1,清空Eden区和from区。
- 当再一次触发YoungGC的时候,会把Eden区中存活下来的对象和to中的对象,移动到from区中,这些对象的年龄会加1,清空Eden区和to区。
- 对象的年龄达到了某一个限定的值(默认15岁),那么这个对象就会进入到老年代中。
当然也有特殊情况,如果进入Eden区的是一个大对象,在触发YoungGC的时候,会直接存放到老年代
当老年代满了之后,触发FullGC。FullGC同时回收新生代和老年代,当前只会存在一个FullGC的线程进行执行,其他的线程全部会被挂起。我们在程序中要尽量避免FullGC的出现。
面试官: MinorGC、MixedGC、FullGC的区别是什么?
候选人:
- MinorGC【young GC】发生在新生代的垃圾回收,暂停时间短(STW)
- MixedGC 新生代 + 老年代部分区域的垃圾回收,G1收集器特有
- FullGC 新生代 + 老年代完整垃圾回收,暂停时间长(STW),应极力避免
面试官: 讲一下新生代、老年代、永久代的区别?
候选人:
嗯!是这样的,简单说就是
新生代主要用来存放新生的对象。
老年代主要存放应用中生命周期长的内存对象。
永久代指的是永久保存区域。主要存放Class和Meta(元数据)的信息。在Java8中,永久代已经被移除,取而代之的是一个称之为“元数据区”(元空间)的区域。元空间和永久代类似,不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存的限制。
说一下JVM有哪些垃圾回收器
面试官: 说一下JVM有哪些垃圾回收器?
候选人:
在JVM中,实现了多种垃圾收集器,包括:
- 串行垃圾收集器:Serial GC、Serial Old GC
- 并行垃圾收集器(JDK8默认):Parallel Old GC、ParNew GC
- CMS(并发)垃圾收集器:CMS GC,作用在老年代
- G1垃圾收集器(JDK9默认),作用在新生代和老年代
详细聊一下G1垃圾回收器
面试官: 详细聊一下G1垃圾回收器?
候选人:
- 应用于新生代和老年代,在JDK9之后默认使用G1
- 划分成多个区域,每个区域都可以充当eden,survivor,old,humongous,其中humongous专为大对象使用
- 采用复制算法
- 响应时间与吞吐量兼顾
- 分成三个阶段:新生代回收(stw)、并发标记(重新标记stw)、混合收集
- 如果并发失败(即回收速度赶不上创建新对象速度),会触发FULL GC
强引用、软引用、弱引用、虚引用的区别
面试官: 强引用、软引用、弱引用、虚引用的区别?
候选人:
- 强引用:只要所以GC Roots能找到,就不会被回收
- 软引用:需要配合SoftReference使用,当垃圾多次回收,内存依然不够的时候回收软引用对象
- 弱引用:需要配合WeakReference使用,只要进行了垃圾回收,就会把弱引用对象回收
- 虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由Reference Handler线程调用虚引用相关方法释放直接内存
JVM实践
JVM调优参数可以在哪里设置参数值
面试官: JVM调优的参数可以在哪里设置参数值?
候选人:
- war包部署在tomcat中设置,修改TOMCAT_HOME/bin/catalina.sh文件
- jar包部署在启动参数设置,java -Xms512m -Xmx1024m -jar xxxx.jar
用的 JVM 调优的参数都有哪些
面试官: 用的 JVM 调优的参数都有哪些?
候选人:
嗯,这些参数是比较多的
我记得当时我们设置过堆的大小,像-Xms和-Xmx
还有就是可以设置年轻代中Eden区和两个Survivor区的大小比例
还有就是可以设置使用哪种垃圾回收器等等。具体的指令还真记不太清楚。
说一下JVM调优的工具
面试官: 嗯,好的,你们平时调试 JVM都用了哪些工具呢?
候选人:
嗯,我们一般都是使用jdk自带的一些工具,比如
jps输出JVM中运行的进程状态信息
jstack查看Java进程内线程的堆栈信息
jmap用于生成堆转存快照
jstat用于JVM统计监测工具
还有一些可视化工具,像jconsole和VisualVM等
Java内存泄漏的排查思路
面试官: 假如项目中产生了java内存泄露,你说一下你的排查思路?
候选人:
嗯,这个我在之前项目排查过
第一,可以通过jmap指定打印它的内存快照dump文件,不过有的情况打印不了,我们会设置vm参数让程序自动生成dump文件
第二,可以通过工具去分析dump文件,jdk自带的VisualVM就可以分析
第三,通过查看堆信息的情况,可以大概定位内存溢出是哪行代码出了问题
第四,找到对应的代码,通过阅读上下文的情况,进行修复即可
CPU飙高的排查方案
面试官: 假如项目中产生了java内存泄露,你说一下你的排查思路?
候选人:
嗯,我考虑一下~~
可以这么做~~
第一,可以使用top命令查看占用cpu的情况
第二,通过top命令查看后,可以查看是哪一个进程占用cpu较高,记录这个进程id
第三,可以通过ps查看当前进程中的线程信息,看看哪个线程的cpu占用较高
第四,可以jstack命令打印进程的id,找到这个线程,就可以进一步定位问题代码的行号