JVM虚拟机入门探究
- 谈谈对JVM的理解?java8虚拟机和之前的变化更新?
- OOM内存溢出,StackOverFlowError栈溢出,怎么分析?
- JVM 的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?
- 谈谈JVM中,类加载器你的认识?rt-jar ext applicatoin
1、JVM的位置
2、JVM的体系结构
- 栈百分百没有垃圾(因为栈的运行方式,不存会在垃圾)
- 所谓的 JVM 调优,99%都是在调方法区和堆,其中主要的是堆!
- 第三方插件,主要是在执行引擎上做,类加载器上比较少
3、类加载器
作用:加载 Class 文件
- 类是抽象的,而对象是具体的
- 对象的引用地址在栈,具体数据在堆
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序(系统类)加载器
4、双亲委派机制
- 为了保证核心 class 安全,不被篡改
- 防止重复加载同一个 class
- APP --> EXC --> BOOT (最终最高级执行)
- BOOT --> EXC --> APP (当最高级没有,再一级一级往回执行)
- 执行顺序
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
- 启动加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器
- 否则,抛出异常,通知子加载器进行加载
- 重复 3 . 4 步骤
5、沙箱安全机制
5.1、什么是沙箱?
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?——CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
-
java中的安全模型
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱 (Sandbox) 机制。 -
JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现
- JDK1.1安全模型
针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限
-
JDK1.2安全模型
在 Java1.2 版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制
- 当前最新版本JDK1.6
引入了域 (Domain) 的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域 (Protected Domain),对应不一样的权限 (Permission)。存在于不同域中的类文件就具有了当前域的全部权限
5.2、沙箱的基本组件
-
字节码校验器(bytecode verifier)
确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类
-
类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码
- 它守护了被信任的类库边界
- 它将代码归入保护域,确定了代码可以进行哪些操作
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见
装载器采用的机制是双亲委派模式
-
从最内层 JVM 自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用
-
由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效
-
存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定
-
安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高
-
安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性
- 安全提供者
- 消息摘要
- 数字签名 keytools
- 加密
- 鉴别
-
6、Native
- native:凡是带了 native 关键字的,说明 Java 的作用范围达不到了,回去调用底层 C 语言的库
- 会进入本地方法栈
- 调用本地方法,本地接口 JNI
- JNI作用:扩展 Java 的使用,融合不同的编程语言为 Java 所用! 最初为c 、 c++
- 它们在内存区域中专门开辟了一块标记区域:Native Method Stack ,登记为 native 方法
- 在最终执行的时候,加载本地方法库中的方法通过 JNI
- 现在使用比较少了,一般在连接硬件或系统程序中,Java程序驱动打印机,管理系统,Robot(),企业级中较为少见
调用其他接口: Socket…WebService…http
用户端–> 输入框(PHP) --> NodeJS —> Socket --> C++ (服务器端)
7、PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,事线程私有的,就是一个指针,指向方法区中的方法字节码(用来存0储指向像一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
8、方法区
Method Area 方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保持在该区域,此区域属于共享区间
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
9、栈
-
栈:数据结构
- 正确:程序 = 数据结构 + 算法
- 不正确:程序 = 框架 + 业务逻辑 :SSM + SpringBoot + SpringCloud
-
栈:先进后出、后进先出:桶
-
队列:先进先出(FIFO : First Input First Output)
-
栈:栈内存,主管程序的运行,生命周期和线程同步;
-
线程结束,栈内存也就释放,对于栈来说,不存在垃圾回收问题
-
栈:8大基本类型 + 对象引用 + 实例的方法
-
栈运行原理:栈帧
-
栈溢出:StcakOverflowError
栈 + 堆 + 方法区 : 交互关系
10、三种JVM
- Sun公司 HotSpot
Java HotSpot(TM) 64-Bit Server VM (build 25.181-b13,mixed mode)
- BEA
JRockit
- IBM
J9 VM
我们学习都是:HotSpo
11、堆
Heap,一个 JVM 只有一个堆内存,堆内存的大小是可以调节的
类加载器读取了类文件后,一般会把什么东西放到堆中?类,方法,常量,变量~,保持我们所有引用类型的真是对象
当栈内某对象长时间不使用或使用1.此后不再被使用,对应的堆实例不再被引用,这时这个堆得实例已变成无用的垃圾
堆内存中还要细分为三个区域
- 新生区(伊甸园区) Young/New
- 伊甸园区(Eden Space):new的地方,并进行第一次垃圾回收(属于轻GC)
- 幸存0区 :第一次垃圾回收的余下数据会在幸存区再次回收(同样属于轻GC)
- 幸存1区 :两个区交替回收
- 养老区 old :经过多次回收,都存活下来的数据将移至养老区(一般养老区回收几率较低),但如果当养老区存储大量数据时,就不得不进行一次重回收(属于重GC Full GC)
- 永久区 Perm :剩下的会到永久区
GC垃圾回收,主要是在伊甸园区和养老区
假设新生区,养老区都满了,就会报错OOM,堆内存不够!java.lang.OutOfMemoryError:Java heap space
在JDK8之后,永久存储区改名为(元空间)
12、新生区、老年区
12.1、新生区
- 类,诞生和成长的地方,甚至死亡
- 伊甸园,所有的对象都是在伊甸园 new 出来的
- 幸存者区(0,1)
12.2、老年区
新生区回收剩下的
经过研究,99%的对象都是临时对象,一般在新生区就会被回收,很少到养老区
13、永久区
-
这个区域常驻内存。用来存放 JDK 自身携带的 Class 对象。Interface 元数据,存储的是 Java 运行时的一些环境或类信息,这个区域不存在垃圾回收!关闭 VM 虚拟就会释放这个区域的内存
-
一个启动类,加载了大量的第三方 jar 包。Tomcat 部署了太多的应用,大量动态生成的反射类,不断的被加载,直到内存满,就会出现OOM
- jdk1.6之前:永久代,常量池是在方法区;
- jdk1.7 :永久代,但是慢慢的退化了,
去永久代
,常量池在堆中 - jdk1.8之后:无永久代,常量池在元空间
-
方法区又叫(非堆)
-
使用interface接口可以将代码存进方法区永久存储下来
-
后来版本持久代统称为元空间
元空间,逻辑上存在:物理上不存在
测试内存
//返回虚拟机试图使用的最大内存
long max = Runtime.getRuntime().maxMemory(); //字节 1024*1024
//返回jvm的初始化总内存
long total = Runtime.getRuntime().totalMemory();
System.out.println("max="+ max+"字节\t"+(max/(double)1024*1024)+"MB");
System.out.println("total="+ max+"字节\t"+(total/(double)1024*1024)+"MB");
默认情况下:分配的总内存 是电脑内存的 1/4,而初始化的内存:1/64
14、堆内存调优
-Xms1024m -Xmx1024m -XX:+PrintGCDetails
内容为:初始内存,总内存和输出GC描述信息
出现OOM错误时:
- 尝试扩大堆内存看结果
- 分析内存,看一下那个地方出现了问题(专业工具)
新生代305664k + 老年代699392k = 1,005,056k 约等于总内存981.5k,没有元空间的内存
所以:元空间,逻辑上存在:物理上不存在
JDK 1.8后,元空间存放在堆外内存中(元空间不在虚拟机设置的内存中,而是使用本地内存.这也就意味着元空间不占用虚拟机内存
在一个项目中,突然出现了OOM故障,那么该如何排除?研究为什么出错?
- 能够看到代码第几行出错:内存快照分析工具,MAT, Jprofiler(最好)
- Dubug, 一行行分析代码!(最慢)
Jprofiler
MAT, Jprofiler作用
- 分析Dump内存文件,快速定位内存泄露;
- 获得堆中的数据
- 获得大的对象
- …
Jprofiler安装
图 Jpro IDEA安装流程
Jprofiler 安装路径不能有(空格)和中文
图 配置地址
Dump出异常
调试可以将内存调小,并设置假设报出OfMemoryError异常,就Dump出来
图 Jprofiler
- 先看内存 Current Object Set --> Biggest Object那个内存特别大,
- 再看线程 Thread Dump --> 那个出了问题
- 在idea中VM参数中写参数 -Xms1m -Xmx8m -XX: +HeapDumpOnOutOfMemoryError
- -Xms设置初始化内存分配大小 1/64
- -Xmx设置最大分配内存,默以 1/4
- -XX: +PrintGCDetails // 打印GC垃圾回收信息
- -XX: +HeapDumpOnOutOfMemoryError //oom DUMP
Runtime 类,用于调优Java运行时的东西
15、GC 垃圾回收器
-
JVM在进行GC时,并不是对这三个区域统一回收。 大部分时候,回收都是新生代
- 新生代
- 幸存区(form,to,两个区域会交互,谁空谁是to)
- 老年区
-
GC两种类:轻GC (普通的GC), 重GC (全局GC),GC主要是释放内存
GC常见面试题目
- JVM的内存模型和分区~详细到每个区放什么?
- 堆里面的分区有哪些?
Eden, form, to, 老年区,说说他们的特点! - GC的算法有哪些?
标记清除法,标记整理,复制算法,引用计数器(很少用) - 轻GC和重GC分别在什么时候发生?
算法:
引用计数器
引用计算法会在每一个对象中加入计数器,再排除使用次数最少的对象
复制算法
将幸存区(from)内对象复制到幸存区(to)区,保证一个幸存区为了空
图 复制算法
图 复制算法过程
- 回收后,Eden 和 幸存区(From)区的对象都将复制到幸存区(To)
- 原幸存区(From)因为没有对象变成幸存区(To)
- 原幸存区(To)因为有了对象变成幸存区(From)
- 当一个对象经过15次GC没有死,将进入养老区
- 好处:没有内存的碎片~
- 坏处:浪费了内存空间~ :多了一半空间永远是空to。
- 假设(极端情况)对象100%存活,幸存区(From)全部复制到幸存区(To),数量太多
复制算法最佳使用场景:对象存活度较低的时候;新生区~
标记清除
图 标题清除
两次标记时间成本过长,标记后出现空档存在内存碎片。但可以优化复制算法空一块幸存区的情况。
-
优点:不需要额外的空间
-
缺点:两次扫描,严重浪费时间,会产生内存碎片
标记压缩
进行再次压缩
图 标记压缩
缺点:多一次移动的成本
标记清除压缩
先进行多次清除,待存在多个内存碎片时,再进行压缩
总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法
思考一个问题:难道没有最优算法吗?
答案 : 没有, 没有最好的算法, 只有最合适的算法 -----> GC:分代收集算法
- 年轻代:
- 存活率低
- 复制算法!
- 老年代:
- 区域大,存活率高
- 标记清除(内存碎片不是太多) + 标记压缩 混合实现
一天时间学习 JVM,是不现实的,需要更多的深究。必须要下去花时间研究,和多看面试题,以及看书《深入理解JVM》。但是,我们可以掌握一个学习 JVM 的方法。
JMM
Java Memory Model java内存模型
-
什么是JMM?
JMM:(Java Memory Model的缩写)
-
它是做什么的?:官方,博客,视频
作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)
JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)
解决共享对象可见性这个问题:volatile
-
它该如何学习?
JMM : 抽象的概念,理论
volatile
未来
学习:
- netty
- Spring Cloud Alibaba
面试:
- 比如:面试题3/10 == pass,面经 = 10,分析这10个
- 通过大量的面试总结,得出一套解题思路