JVM探究
面试常见:
- 请你谈谈你对JVM的理解?java8虚拟机和之前的变化更新?
- 什么是OOM,什么是栈溢出StackOverFlowError?怎么分析?
- JVM的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?
- 谈谈JVM中,类加载器你的认识
大致本文学习结构
1.JVM的位置
程序通过java XX.class运行,这个命令是JRE的命令,JRE中包括JVM,而JRE是建立在操作系统上使用的,操作系统又是基于硬件为基础的。
2.JVM的体系结构
javac -->变class文件
百分之99的JVM调优都是在堆中调优,Java栈、本地方法栈、程序计数器是不会有垃圾存在的。
3.类加载器
作用:加载==.Class==文件~ new student ,具体的引用放在栈,具体的人放在堆里
类加载流程(三个阶段):
1.加载阶段
- 将编译好的class文件加载到内存中(方法区),然后会生成一个代表这个类的Class对象。
2.链接阶段
- 会为静态变量分配内存并设置默认值。
3.初始化阶段
- 执行类构造器()进行初始化赋值。
图 类在经过Class Loader之后的变化
注:Java调用不到会不存在
1.虚拟机自带的加载器
2.启动类(根)加载器
3.扩展类加载器
4.应用程序加载器
5.百度:双亲委派机制
(若classLoader为AppClassLoader 则classLoader.getParent()为ExtClassLoader扩展类加载器
java自带的类加载器:
- 启动类加载器(BootstrapClassLoader):又名根类加载器或引导类加载器,负责加载%JAVA_HOME%\bin目录下的所有jar包,或者是-Xbootclasspath参数指定的路径,例:rt.jar
- 拓展类加载器(ExtensionClassLoader):负责加载%JAVA_HOME%\bin\ext目录下的所有jar包,或者是java.ext.dirs参数指定的路径
- 系统类加载器(ApplicationClassLoader):又名应用类加载器,负责加载用户类路径上所指定的类库,如果应用程序中没有自定义加载器,那么此加载器就为默认加载器
4.双亲委派机制
- 双亲委派机制:安全
- 1.APP-> EXC->BOOT(最终执行)
类加载器收到加载请求
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成, 一直向上委托, 直到启动类加载器(根加载器rt)
- 启动类加载器检查是否能够加载当前这个类, 能够加载就结束了, 使用当前加载器,否则抛出异常,通知子类加载器进行加载.
- 重复步骤3.
(Class Not Found异常)
优点:避免重复加载 + 避免核心类篡改
- 小知识点:
- (1)Java早期的名字C+±-
- (2)JAVA = C++去掉繁琐的东西:指针、内存管理
5.沙箱安全机制
Java安全模型的核心就是Java沙箱(sandbox) , 什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。
沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。
不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱Sandbox)机制。如下图所示JDK1.0安全模型
图 JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示
JDK1.1安全模型
在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示
图JDK1.2安全模型
当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)
图 JDK1.6安全模型
组成沙箱的基本组件
-
字节码校验器(bytecode verifier) :确保Java类文件遵循Java语言规范。
这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。 -
类裝载器(class loader) :其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码;
- 它守护了被信任的类库边界;
- 它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。 类装载器采用的机制是双亲委派模式。 - 从最内层JVM 自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
-
存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
-
安全管理器(security manager) : 是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
-
安全软件包(security package) : java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,
-
包括: (1)安全提供者 (2)消息摘要 (3) 数字签名 (4)加密 (5)鉴别
6.Native (唬住,加分)
程序中使用:private native void start0();
- 凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库!
- 会进入本地方法栈,然后去调用本地方法接口JNI 将native方法引入执行
JNI作用:
(1)开拓Java的使用,融合不同的编程语言为Java所用!
最初: C、C++ Java诞生的时候C、C++横行,想要立足,必须要有调用C、C++的程序
(2) 它在内存区域中专门开辟了一块标记区域: Native Method Stack,登记native方法
(3)在最终执行的时候,加载本地方法库中的方法通过JNI (java Native Interface)
例如:Java程序驱动打印机,管理系统,掌握即可,在企业级应用比较少
private native void start0();
//调用其他接口:Socket. . WebService http~
Native Method Stack
本地方法栈(Native Method Stack)
内存区域中专门开辟了一块标记区域: Native Method Stack,负责登记native方法,在执行引擎( Execution Engine )执行的时候通过==本地方法接口(JNI)==加载本地方法库中的方法
Native Interface本地接口
本地方法接口(JNI)
本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序, Java在诞生的时候是C/C++横行的时候,想要立足,必须有调用C、C++的程序,然后在内存区域中专门开辟了一块标记区域: Native Method Stack,负责登记native方法,在执行引擎( Execution Engine )执行的时候通过本地方法接口(JNI)加载本地方法库中的方法
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍!
7.PC寄存器(了解)
程序计数器: Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计
为什么需要程序计数器?
记录要执行的代码位置,防止线程切换重新执行
字节码执行引擎修改程序计数器的值
8.方法区Method Area
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间。
静态变量(static)、常量(final)、类信息(构造方法、接口定义)(Class)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关 (!!!重要)
static、final、Class、常量池
java
private int a
private String name = "qinjiang";
main{
Test test1 = new Test();
test1.a = 1;
test1.name = "123";
}
9.栈
图 为什么main()先执行,最后结束~
栈:先进后出 桶:后进先出 队列:先进先出( FIFO : First Input First Output )
喝多了吐就是栈,吃多了拉就是队列
栈:后进先出,每个线程都有自己的栈,栈内存主管程序的运行,生命周期和线程同步,线程结束,栈内存也就释放。对于栈来说,不存在垃圾回收问题,一旦线程结束,栈就结束.
栈内存中运行:8大基本类型+对象引用+实例的方法.
栈满了:StackOverflowError
图 栈的位置示意图
栈运行原理:栈桢
图 栈帧图解 栈底部子帧指向上一个栈的方法 上一个栈的父帧指向栈底部方法
- 栈+堆+方法区:交互关系
- 补充亮点: 类实例化后的过程,到Java基础中的面向对象编程中去找
10.三种JVM
- Sun公司HotSpot Java Hotspot™ 64-Bit Server VM (build 25.181-b13,mixed mode)
- BEA JRockit
- IBM J9VM
我们学习都是: Hotspot
11.堆 heap
一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取类文件后,一般会把类,方法,常量,变量,我们所有引用类型的真实对象,放入堆中。
堆内存细分为三个区域:
- 新生区(伊甸园区):Young/New
- 养老区old
- 永久区Perm
图 堆内存详细划分
- GC垃圾回收,主要是在伊甸园区和养老区~
- 假设内存满了,OOM,堆内存不够! java.lang.OutOfMemoryError:Java heap space
- 永久存储区里存放的都是Java自带的 例如lang包中的类 如果不存在这些,Java就跑不起来了
- 在JDK8以后,永久存储区改了个名字(元空间)
图 堆内存溢出
12.新生区、老年区
新生区
新生区:类的诞生,成长和死亡的地方
分为:
- 伊甸园区:所有对象都在伊甸园区new出来
- 幸存0区和幸存1区:轻GC之后存下来的
图 重GC和轻GC
伊甸园满了就触发轻GC,经过轻GC存活下来的就到了幸存者区,幸存者区满之后意味着新生区也满了,则触发重GC,经过重GC之后存活下来的就到了养老区。 真理:经过研究,99%的对象都是临时对象!|
老年区(养老区):多次轻GC存活下来的对象放在老年区
13.永久区
这个区域常驻内存的。用来存放JDK自身携带的Class对象。
Interface元数据,存储的是Java运行时的一些环境~
这个区域不存在垃圾回收,关闭虚拟机就会释放内存
- jdk1.6之前:永久代,常量池是在方法区;
- jdk1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
- jdk1.8之后:无永久代,常量池在元空间
图 JVM探究
元空间:逻辑上存在,物理上不存在 (因为存储在本地磁盘内) 所以最后并不算在JVM虚拟机内存中
默认情况下,JVM使用的最大内存为电脑总内存的四分之一,JVM使用的初始化总内存为电脑总内存的六十四分之一.
总结:
- 栈:基本类型的变量,对象的引用变量,实例对象的方法
- 堆:存放由new创建的对象和数组
- 方法区:Class对象,static变量,常量池(常量)
14.堆内存调优
测试代码
public static void main(String[] args) {
String s = "";
while (true) {
s += "11111111111111111111111111111111111111111111111111111";
}
}
图 虚拟机放入参数
图 控制台报错 到最后会报OOM(OutOfMemory)堆内存溢出报错
OOM:堆内存溢出
- 尝试扩大堆内存看结果
-Xms1024m -Xmx1024m -xx:+PrintGCDetails - 分析内存,看一下哪个地方出现了问题 (专业工具)
在一个项目中,突然出现了OOM故障,那么该如何排除 研究为什么出错~
能够看到代码第几行出错:内存快照分析工具,MAT, Jprofiler
Dubug, 一行行分析代码!
MAT, Jprofiler作用
- 分析Dump内存文件,快速定位内存泄露;
- 获得堆中的数据
- 获得大的对象~
MAT是eclipse集成使用 在这里不学
Jprofile使用
- 在idea中下载jprofile插件
- .联网下载jprofile客户端
- 在idea中VM参数中写参数 -Xms1m -Xmx8m -XX: +HeapDumpOnOutOfMemoryError
- 运行程序后在jprofile客户端中打开找到错误 告诉哪个位置报错
命令参数详解
- -Xms设置初始化内存分配大小1/64
- -Xmx设置最大分配内存,默以1/4
- -XX: +PrintGCDetails // 打印GC垃圾回收信息
- -XX: +HeapDumpOnOutOfMemoryError //oom DUMP
15.GC
GC垃圾回收
GC:作用区域 堆+方法区
JVM在进行GC时,并不是对这三个区域统一回收。大部分时候,回收都是新生代~
- 新生代
- 幸存区(from,to)
- 老年代
GC两种类:轻GC(普通的GC),重GC(全局GC)
GC常见面试题:
-
JVM的内存模型和分区~详细到每个区放什么?
-
堆里面的分区有哪些?Eden,from,to,老年代,说说他们的特点!
-
GC的算法有哪些?四大算法:引用计数法、复制算法、标记-清除算法、标记-压缩算法
-
轻GC和重GC分别在什么时候发生?
算法
1. 引用计数法
图 引用计数法 很少使用了
2. 复制算法
图 复制算法图解
- 好处:没有内存的碎片~
- 坏处:浪费了内存空间~ 多了一半空间永远是空to。假设对象 100% 存活(极端情况)
复制算法最佳使用场景:对象存活度较低的时候;新生代~
3.标记-清除算法
- 优点:不需要额外的空间!
- 缺点:两次扫描,严重浪费时间,会产生内存碎片。
4.标记-压缩算法(优化标记清除)
4. 标记清除压缩
先标记清除几次
再压缩~
如何选择四种算法:
总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法(空间复杂度)
思考一个问题:难道没有最优的算法吗?
答案:没有,没有最好的算法。只有最合适的算法 -----> GC:分代收集算法
新生代:
- 存活率低
- 复制算法!
老年代:
- 区域大、存活率高
- 标记清除(内存碎片不太多) + 标记压缩 混合实现
16.JMM
JMM–>并发,主内存和拷贝出来的内存是否一致–>
解决方案:volilate(解决一致性) 和synchronized—>面试题答案
1.什么是JMM?
JMM :(java Memory Model 缩写)java内存模型
2.他是干什么的?
作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)。
JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)
解决共享对象可见性的问题:volilate
(写完的东西立马可以刷新到主内存,一致性)
3.它该如何学习
JMM:抽象的概念,理论
volilate
总结
总结面试面经