JVM
一、java平台无关性
1. 跨平台过程
Java源码首先被编译成字节码,再由不同平台的JVM进行解析,Java语言在不同的平台上运行时不需要进行重新编译,Java虚拟机在执行字节码的时候,把字节码转换成具体平台上的机器指令。
2. 为什么JVM不直接将源码解析成机器码去执行
(1)减少准备工作:每次执行都需要各种检查;
(2)兼容性:也可以将别的语言解析成字节码;
(3)如何查看字节码?
Javap
4. JVM结束生命周期的集中原因
(1)执行了System.exit()方法
(2)程序正常执行结束后退出;
(3)程序因异常或错误而异常终止退出;
(4)执行程序因操作系统错误退出或异常
二、JVM如何加载.class文件
1. JVM是内存中的虚拟机(jvm架构)
(1)Class Loader类加载器:依据特定格式,加载class文件到内存;
(2)Execution Engine解释器:对命令进行解析,解析完成提交到OS中执行;
(3)Native Interface:融合不同开发语言的原生库为Java所用,比如Class.forName();JVM在内存区域开辟了一块区域,专门处理标记为native的代码(即不是java写的代码),具体做法就是在Native Method Stack中登记Native方法,在Execution Engine执行时,加载native Libraies。
(4)Runtime Data Area:JVM内存空间结构模型
2. 类成员加载顺序
(1)static变量
(2)static代码块
(3)成员变量
(4)匿名块
(5)构造器
三、反射
1. 反射机制
Java反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法;对于任意一个对象,都能够调用它的任意方法和属性;这种动态获取信息以及动态调用对象的方法的功能称之为java语言的反射机制。反射就是将java中的各种成分映射成一个个类;
2. 实例
(1)Class.forName():查找类名,类名要全;
(2)newInstance():创建对象
(3)getDeclaredMethod方法可以获得任意一个方法,除了继承的方法或者接口的重载;
(4)Invoke(需要反射的类名,传参):启动方法
(5)setAccessible():如果是私有域或者对象,需要设置为true,以开启权限;
四、ClassLoader
1. 类从编译到执行的过程
(1)编译器将*.java源文件编译为*.class字节码文件;
(2)ClassLoader将字节码转换为JVM中的Class<*>对象;
(3)JVM利用Class<*>对象实例化为*对象;
2. ClassLoader
ClassLoader在java中有着非常重要的作用,它主要工作在Class装载的加载阶段,其主要作用是从系统外部获得Class二进制数据流。它是java的核心组件,所有的Class都是由ClassLoader进行加载的,ClassLoader负责通过将Class文件里的二进制数据流装载进系统,然后交给JVM进行连接、初始化等操作。
(1)ClassLoader是一个抽象类;
(2)通过loadClass(String name)方法才能加载到类,返回代表类的实例;
3. ClassLoader的种类
(1)BootStrapClassLoader:C++编写,加载核心库java.*;
(2)ExtClassLoader:java编写,加载扩展库javax.*;getExtDirs()方法,通过java.wet.dirs路径,获取class文件,返回File[]对象
(3)AppClassLoader:java编写,加载程序所在目录;路径为java.class.path;
(4)自定义ClassLoader:java编写,定制化加载
4. 自定义ClassLoader的实现
(1)关键函数
a. 用来寻找class文件
b. 定义一个类
五、类加载器的双亲委派机制
1. 流程
MyClassLoader->AppClassLoader->Ext-ClassLoader->BootStrap.自定定义的MyClassLoader首先会先委托给AppClassLoader,AppClassLoader会委托给ExtClassLoader,ExtClassLoader会委托给BootStrap,这时候BootStrap就去加载,如果加载成功,就结束了。如果加载失败,就交给ExtClassLoader去加载,如果ExtClassLoader加载成功了,就结束了,如果加载失败就交给AppClassLoader加载,如果加载成功,就结束了,如果加载失败,就交给自定义的MyClassLoader类加载器加载,如果加载失败,就报ClassNotFoundException异常,结束。
2. 使用双亲委派机制的原因
(1)避免多份同样字节码的加载
(2)为了系统类的安全
六、loadClass和forName的区别
1. 类的加载方式
(1)隐式加载:new
(2)显式加载:loadClass和forName;
2. 类的装载过程
(1)加载:通过ClassLoader加载class文件字节码,生成Class对象;
(2)链接:
a. 校验:检查加载的class的正确性和安全性;
b. 准备:为类变量分配存储空间并设置类变量初始值;
c. 解析:JVM将常量池内的符号引用转换为直接引用;
(3)初始化:执行类变量赋值和静态代码块
3. loadClass和forName的区别
(1)Class.forName()得到的class是已经初始化完成的
(2)ClassLoader.loadClass得到的class是还没有链接的
七、Java内存模型
1. 地址空间
(1)内核空间:操作程序运行时的空间,调度程序等;
(2)用户空间:
2. JVM内存模型
(1)线程私有:程序计数器、虚拟机栈、本地方法栈
(2)线程共享:MetaSpace、常量池、堆
3. 程序计数器Program Counter Register
(1)当前线程所执行的字节码行号指示器,它是逻辑计数器;
(2)字节码指示器工作时通过改变计数器的值来选取下一条需要执行的字节码指令;
(3)每条线程需要独立的PCR,和线程是一对一的关系即线程私有;
(4)若果执行的是java方法,那么PCR记录的是虚拟机字节码指令的地址,如果是Native方法则计数器值为Undefined
(5)不会发生内存泄露
4. Java虚拟机栈Stack
(1)java方法执行的内存模型
(2)每个方法被执行时都会创建一个栈帧,即方法运行时的基础数据结构;栈帧被用来存储局部变量表、操作栈、动态链接、返回地址等;当方法调用结束时,帧才会被销毁
a. 局部变量表:包含方法执行过程中的所有变量
b. 操作数栈:操作数栈在执行字节码指令过程中被用到,大部分jvm字节码把时间花费在操作数栈的操作上,包括入栈、出栈、复制、交换、产生消费变量
Store:操作数栈顶出栈,局部变量表入栈;
Load:局部变量表栈顶出栈,操作数栈顶入栈
5. 递归为什么会引发java.lang.StackOverflowError异常
递归过深,栈帧超出虚拟机栈深度。
6. 虚拟机栈过多会引发java.lang.OutOfMemoryErrory异常
7. 本地方法栈
与虚拟机栈相似,主要作用于标注了native的方法;
8. 元空间MetaSpace和永久代PermGen的区别
(1)元空间使用本地内存,而永久代使用的是jvm的内存;
(2)在jdk1.8中利用元空间代替永久代
9. 元空间相比永久代的优势
(1)字符串常量池存在永久代中,容易出现性能问题和内存溢出;
(2)类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出。;
(3)永久代会为 GC 带来不必要的复杂度,并且回收效率偏低;
(4)方便HotSpot与其他jvm,如Jrockit的集成;
10. Java堆
(1)对象实例的分配区域;
(2)Java堆是GC器管理的主要区域;
(3)Java堆分区:新生代;老年代
11. Jvm三大性能调优参数
(1)-Xss:规定了每个线程虚拟机栈(堆栈)的大小;一般是256k
(2)-Xms:堆的初始值;该进程该创建时专属java堆的大小,一旦超过java堆的初始容量,则自动扩容至最大值;
(3)-Xmx:堆能达到的最大值;
(4)通常情况下,我们会将-Xms和-Xmx设置成一样的,因为当heap不够用而扩容时会发生内存抖动,影响程序运行是的稳定性;
12. jvm问题排查指令
(1)jps:输出jvm运行时的进程状态信息
a. -q:输出类名、Jar名和传入main方法的参数;
b. -m:输出传入main方法的参数
c. -l:输出main类或Jar的全限名
d. -v:输出传入JVM的参数
(2)jstat:用于持续观察虚拟机内存中各个分区的使用率以及GC的统计数据。
(3)jmap [option] pid:用来查看堆内存的使用详情
(4)jstack [option] pid:用来查看Java进程内的线程堆栈信息,在发生死锁时可以用jstack -l pid来观察锁持有情况
(5)jinfo: 用于查看 jvm 的配置参数
13. Java内存模型中堆和栈的区别——内存分配策略
(1)静态存储:编译时确定每个数据目标在运行是的存储空间需求;
(2)栈式存储:程序对数据区的需求在编译时未知,在运行时,必须在模块入口前确定;
(3)堆式存储:在编译时或运行时,模块入口处都无法确定存储要求的数据结构的内存分配,动态分配;
14. Java内存模型中堆和栈的区别
(1)联系:引用对象、数组时,栈里定义变量是保存在堆中目标的首地址;
(2)区别:
a. 管理方式:栈空间自动释放,堆空间需要GC自动回收释放资源;
b. 空间大小:栈比堆小;
c. 碎片相关:栈产生的内存碎片远小于堆;
d. 分配方式:栈支持静态和动态分配,而堆仅支持动态分配;
e. 效率:栈的效率比堆高;
八、Java垃圾回收机制
1. 对象被判定为垃圾的标准
没有被其他任何对象引用。
2. 判定对象是否为垃圾的算法
(1)引用计数法:
(2)可达性分析算法:
3. 引用计数算法
(1)通过判断对象的引用数量来决定对象是否可以被回收;
(2)每个对象实例都有一个引用计数器,被引用则+1,完成引用则-1;
(3)任何引用计数为0的对象实例可以被当做垃圾收集
(4)优点:执行效率高,程序执行受影响较小
(5)缺点:无法检测出循环引用的情况,导致内存泄露;
4. 可达性分析算法
通过判断对象的引用链是否可达来决定对象是否可以被回收。
5. 可以作为GC Root的对象
(1)虚拟机栈中引用的对象(栈帧中的本地变量表);
(2)常用引用的对象;
(3)由系统类加载器(system class loader)加载的对象,这些类是不能够被回收的,他们可以以静态字段的方式保存持有其它对象本地方法栈中JNI(native方法)的引用对象;
(4)活跃线程的引用对象;
6. 垃圾回收算法
(1)标记-清除算法Mark and Sweep
a. 标记:从跟集合进行扫描,对存活的对象进行标记;
b. 清除:对堆内存从头到尾进行线性遍历,回收不可达的内存对象
c. 缺点:会产生大量的内存碎片;
(2)复制算法Copying:
a. 分为对象面和空闲面;
b. 对象在对象面上创建;
c. 对存活的对象,从对象面复制到空闲面;
d. 再将对象面所有对象清除
e. 优点:解决了碎片化问题;顺序分配内存,简单高效;适用于对象存活率低的场景,比如年轻代GC;
(3)标记-整理算法Compacting
a. 标记:从根集合进行扫描,对存活的对象进行标记;
b. 清除:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收;
c. 优点:避免的了内存的不连续性;不用设置两块内存互换;适用于存活率高的场景,比如老年代GC;
(4)分代收集算法Generational Collector
a. 垃圾回收算法的组合;
b. 按照对象生命周期的不同划分区域以采用不同的垃圾回收算法;
c. 目的:对象分区存储,提高jvm的回收效率
7. 分代收集算法
(1)GC的分类:Minor GC年轻代;Full GC老年代
(2)年轻代GC:尽可能快速的收集掉那些生命周期短的对象
a. Eden区:对象刚创建的时候,一般就是在这个区,但当空间不足是也会滑落到Survivor区;
b. 两个Survivor区:一个是Survivor-from区,一个是Survivor-to区,但是这两个区的空间位置不固定;
(3)年轻代垃圾回收机制的过程
a. 对象在Eden区创建,Eden区最多可以容纳4个对象;
b. 触发Minor GC,回收无用对象,将存活对象放入Survivor区,并且存活对象年龄+1;
c. 对象再次在Eden区创建,之后再次触发Minor GC,将Eden区和之前Survivor区中的存活对象移动到另一个Survivor区中,并且存活对象年龄+1;
d. 周而复始;当年龄超过某个值时,一般默认是15,对象则会移动到老年代,也可以通过设置-XX:MaxTenuringThreshold的值来修改默认年龄,或者当Eden区和Survivor区空间不够用时,对象也会进入老年代
(4)对象如何晋升到老年代
a. 对象经历了一定的Minor GC次数依然存活的对象;
b. Survivor区中存放不下的对象;
c. 新生成的大对象(-XX:+PretenuerSizeThreshold)
(5)常用的调优参数
a. -XX:SurvivorRatio:Eden和Survivor的比值,默认是8:1;
b. -XX:NewRatio:老年代和年轻代内存大小的比例(通过调整比例,可以避免Full GC)
c. -XX:MaxTenuringThreshold:对象从年轻代晋升到老年代经过GC次数的最大阈值
(6)老年代GC:回收生命周期较长的对象
a. 老年代GC一般指的就是Full GC和Major GC;
b. Full GC比Minor GC慢,但执行频率低
(7)触发Full GC的条件
a. 老年代空间不足;
b. 永久代空间不足(但是只是针对jdk1.7之前的版本,在jdk1.8之后,由于使用元空间,则不存在这个问题)
c. CMS GC时出现promotion failed,concurrent mode failure
d. 由Eden区、From Space区向To Space区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小
e. 调用System.gc()
f. 使用RMI(Remote Method Invocation远程方法调用)来进行RPC(Remote Procedure Call远程方法调用)或管理的jdk应用,每小时执行一次Full GC
8. 年轻代垃圾收集器
(1)Stop-the-World
a. Jvm由于要执行GC而停止了应用程序的执行
b. 会在任何一种GC算法中发生
c. 多数GC优化通过减少Stop-the-World发生的时间来提高程序性能,从而是系统具有高吞吐、低停顿
(2)Safepoint
a. 在可达性分析中,分析过程中对象引用关系不会发生变化的点;
b. 产生safepoint的地方:方法调用;循环跳转;异常跳转等。
c. 安全点的选择如果太少,则会让GC等待太长时间;如果太多,则会增加程序运行负荷
九、常见的垃圾收集器
1. Jvm的运行模式
(1)Server模式:启动较慢,但是启动进入稳定期并长期运行之后,程序运行速度要比Client模式要快;
(2)Client模式:启动较快
2. 垃圾收集器之间的联系
如果连个收集器之间有连线,说明可以搭配使用。
3. 年轻代的垃圾收集器
(1)Serial收集器:-XX:+UseSerialGC,复制算法
a. 单线程收集,进行垃圾收集时,必须暂停所有的工作线程;
b. 简单高效,Client模式下的默认的年轻代垃圾收集器
(2)ParNew收集器:-XX:+UseParNewGC,复制算法
a. 多线程收集,其余的行为、特点和Serial收集器一样
b. 单核执行效率不如Serial,在多核下执行下才有优势
c. 可开启的线程数与CPU线程数相同;
(3)Parallel Scavenge收集器:-XX:+UseParallelGC,复制算法
a. 吞吐量=运行时间/(运行用户代码时间+垃圾收集时间)
b. 比起关注用户线程停顿时间,更关注系统的吞吐量
c. 在多核下执行才有优势,Server模式下默认的年轻代收集器
d. 在启动参数中,输入-XX:+UseAdaptiveSizePolicy,将内存管理的调优任务交给虚拟机去完成
4. 老年代的垃圾收集器
(1)Serial Old收集器:-XX:+UseSerialOldGC,标记-整理算法
a. 单线程收集,进行垃圾收集是时,必须暂停所有的工作线程
b. 简单高效,Client模式默认的老年代垃圾收集器
(2)Parallel Old收集器:-XX:+UseParallelOldGC,标记-整理算法
a. 多线程,吞吐量优先
(3)CMS收集器:-XX:UseConcMarkSweepGC,标记-清除算法
a. 即Concurrent Low Pause Collector,它的主要适合场景是对响应时间的重要性需求 大于对吞吐量的要求,能够承受垃圾回收线程和应用线程共享处理器资源,并且应用中存在比较多的长生命周期的对象的应用。CMS是用于对tenured generation的回收,也就是老年代的回收,目标是尽量减少应用的暂停时间,减少Full gc发生的几率,利用和应用程序线程并发的垃圾回收线程来标记清除年老代。在我们的应用中,因为有缓存的存在,并且对于响应时间也有比较高的要求,因此希 望能尝试使用CMS来替代默认的server型JVM使用的并行收集器,以便获得更短的垃圾回收的暂停时间,提高程序的响应性。
b. 不会压缩存活的对象,会带来内存碎片化问题
(4)CMS收集器流程
a. 初始标记:stop-the-world
b. 并发标记:并发追溯标记,程序不会停顿
c. 并发预清理:查找执行并发标记阶段从年轻代晋升到老年代的对象
d. 重新标记:暂停虚拟机,扫描CMS堆中的剩余对象,扫描从根对象开始,向下追溯,并处理对象关联
e. 并发清理:清理垃圾对象,程序不会停顿
f. 并发重置:重置CMS收集器的数据结构
5. Garbage First收集器:-XX:UseG1GC,复制+标记-整理算法
(1)Garbage First收集器的特点
a. 并行和并发:使用多个CPU来缩短stop-the-world的停顿时间,与用户线程并发执行;
b. 分代收集:独立管理整个堆,采用不同的方式管理新创建的对象和已创建一段时间的对象
c. 空间整合:使用了标记-整理算法,没有内存碎片化的问题
d. 可预测停顿:
e. Garbage First是横跨年轻代和老年的垃圾收集器
(2)使用Garbage First收集器的内存布局
a. 将整个java堆内存划分成对个大小相等的region;
b. 年轻代和老年代不在物理隔离
6. Epsilon GC和Z GC(jdk11以后)
十、GC相关的面试题
1. Object的finalize()方法的作用是否与c++的析构函数相同?
(1)与c++的析构函数不同,析构函数调用确定,而它是不确定的;
(2)将未被引用的对象放置在F-Queue队列
(3)方法执行随时可能会被终止
(4)给与对象最后一次重生的机会
2. Java中的强引用、软引用、弱引用,虚引用有什么用?
(1)强引用Strong Reference
a. 最普遍的引用:Object obj = new Object();
b. Jvm宁愿抛出OutOfMemoryError终止程序也不会回收具有强引用的对象;
c. 通过将对象设置为null来弱化引用,使其被回收
(2)软引用Soft Reference
a. 对象处在有用但非必须的状态;
b. 只用在内存空间不足时,GC会回收该应用的对象
c. 软应用可以用来实现内存敏感的高速缓存
(3)弱引用Weak Reference
a. 非必须的对象,比软引用的强度更弱一些
b. 弱引用具有更短的生命周期,GC在扫描的过程中,GC会回收具有软引用关联的对象;
c. 被回收的概率也不大,因为GC线程优先级比较低
d. 适用于引用偶尔被使用且不影响垃圾收集的对象
(4)虚引用Phantom Reference
a. 不会决定对象的生命周期;
b. 任何时候都有可能被GC回收;
c. 跟踪对象被垃圾收集器回收的活动,起哨兵的作用;
d. 必须和引用队列ReferenceQueue联合使用
(5)强引用>软引用>弱引用>虚引用
(6)引用相关的类层次结构
(7)引用队列ReferenceQueue
a. 无实际存储结构,存储逻辑依赖于内部节点之间的关系来表达
b. 存储关联的且被GC的软引用,弱引用和虚引用调用