日常女娲补天式学习,赶紧准备找实习了(笔记内容来自狂神JVM入门视频)
JVM体系结构
大概的简图
单独解释一下类加载器的作用
作用:加载class文件
加载器几种分类
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序加载器
类加载器结构简图
补充一下:从Car—>ClassLoader可以用getClassLoader
双亲委派机制
先说说什么是双亲委派机制:
当某个类加载器需要加载某个.class文件时,它首先把这个任务委托给他的上级类加载器,递归这个操作,如果上级的类加载器没有加载,自己才会去加载这个类。
双亲委派机制的作用:
1、防止重复加载同一个.class。通过委托去向上面问一问,加载过了,就不用再加载一遍。保证数据安全。
2、保证核心.class不能被篡改。通过委托方式,不会去篡改核心.class,即使篡改也不会去加载,即使加载也不会是同一个.class对象了。不同的加载器加载同一个.class也不是同一个Class对象。这样保证了Class执行安全。
为了保证安全会把你调用的方法一级一级从上(java.lang包)往下(你自己写的包)找,直到找到这个方法
加载过程
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
- 启动类加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器,否则,抛出异常,通知子加载器进行加载
- 重复步骤3
如果找不到了,就会爆出错误:Class Not Found
加载器之间的层级关系
就是怕你乱改JDK的文件
这样便可以防止核心API库被随意篡改。
沙箱安全机制
什么是沙箱?
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?——CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
Native、方法区
native
native是个关键字,凡是带了native关键字的方法,说明Java的作用范围达不到了,他会去调用底层C语言的库,会进入本地方法栈,调用本地方法接口JNI(Java Native Interface)。
那么JNI的作用是什么?为了扩展java的使用,融合不同的编程语言,为Java所用。最初是为了调用C和C++
它在内存区域中专门开辟了一块标记区域:Native Method Stack 来登记 native 方法
在最终执行的时候,加载本地方法库中的方法通过JNI
PC寄存器
程序计数器: Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计
方法区
Method Area方法区
方法区是被所有的线程共享,所有字段和方法区字节码,以及一些特殊方法,如构造函数,接口代码也在此定义。简单说,所有定义的方法的信息都被保存在该区域,此区域属于共享区间,线程共享!!!。
方法区要存哪些东西:
静态变量、常量、类信息(构造方法,接口定义)、运行时的常量池存在方法区中、但是实例变量存在堆内存中,和方法区无关(要背)
栈
先进后出后进先出的类桶式的数据结构,经常性的和队列(先进先出)做比较
一般来说也可以叫栈内存,主管程序的运行,生命周期和线程同步。线程结束,栈内存也就随之释放
对于栈来说不存在垃圾回收,方法用完就弹走了,也就不存在产生垃圾的情况
那什么东西放在栈里面呢?
栈:8大基本类型+对象引用+实例的方法
栈溢出的情形
package JVM;
public class Test {
public static void main(String[] args) {
Test test = new Test();
test.test();
}
public void test(){
a();
}
public void a(){
test();
}
}
输出结果
Exception in thread "main" java.lang.StackOverflowError
at JVM.Test.a(Test.java:12)
at JVM.Test.test(Test.java:9)
at JVM.Test.a(Test.java:12)
at JVM.Test.test(Test.java:9)
......
两个方法你调我我调你,互相调,进入类似死循环无限压栈的场景,这种情况下,反复创建对象压栈,没有办法弹栈,就一直积压下去,直到超出了JVM的栈内存,这个时候就有了熟悉的报错
Exception in thread "main" java.lang.StackOverflowError
栈运行原理:栈帧
栈帧:局部变量表+操作数栈
每执行一个方法,就会产生一个栈帧。程序正在运行的方法永远都会在栈的顶部
(栈+堆+方法区)的交互关系
三种JVM
Sun公司HotSpot java Hotspot™64-Bit server vw (build 25.181-b13,mixed mode)
BEA JRockit
IBM 39 VM
我们学习都是:Hotspot
堆
Heap,一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放到堆中?类,方法,常量,变量~,保存我们所有引用类型的真实对象;
堆中存什么?栈中存什么?抄来的笔记:堆中存的是对象。栈中存的是基本数据类型和堆中对象的引用。一个对象的大小是不可估计的,或者说是可以动态变化的,但是在栈中,一个对象只对应了一个4btye的引用(堆栈分离的好处:))。为什么不把基本类型放堆中呢?因为其占用的空间一般是1~8个字节——需要空间比较少,而且因为是基本类型,所以不会出现动态增长的情况——长度固定,因此栈中存储就够了,如果把他存在堆中是没有什么意义的(还会浪费空间,后面说明)。可以这么说,基本类型和对象的引用都是存放在栈中,而且都是几个字节的一个数,因此在程序运行时,他们的处理方式是统一的。但是基本类型、对象引用和对象本身就有所区别了,因为一个是栈中的数据一个是堆中的数据。最常见的一个问题就是,Java中参数传递时的问题。
堆内存中还要细分为三个区域:
- 新生区(伊甸园区) Young/New
- 养老区 old
- 永久区 Perm GC:Garbage recycling
轻GC:轻量级垃圾回收,主要是在新生区 重GC(Full GC):重量级垃圾回收,主要是养老区,重 GC就说明内存都要爆了
从伊甸园到幸存区是一个对象经历过多轮GC还存在,这个时候就把这个对象传入幸存区,幸存区再多轮GC,还能存活的就继续往下走到养老区养老
GC垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,OOM(Out Of memory),堆内存不够!java.lang.OutOfMemoryError: Java heap space
在JDK8以后永久存储区改了个名字(元空间),常量池的位置就在元空间
;
大部分对象实际上都是临时对象
新生区
作用:类诞生,成长,甚至是死亡(被GC掉)(99%的类就止步于此就被GC了)
新生区分为三个部分
- 伊甸园区:所有的对象都在伊甸园区new出来的。如果伊甸园区一共可以放10个对象,当对象达到10个的上限时,就会触发一次
轻GC
,假设十个对象,有九个都没有引用,只有一个有引用地址,那么这个正在被使用的对象,就会被送入幸存者0区。这一轮GC就剩下来一个,移入了幸存者0区。 - 幸存者0区:重复上述过程,也是当幸存者0区都放满了,需要清空间的时候,就会重复上述的步骤,并将幸存下来的对象送入幸存者1区。
- 幸存者1区:和幸存者0区做了相同的事情。这个时候就会有一个新的问题,如果幸存者1区也满了,也就是新生区都满掉了怎么办?这个时候将触发
重GC(FULL GC)
很少会有重GC的情况,在重GC下,三个区都会进行一次清理。能存活下来的对象都存入了养老区
那么,养老区满了怎么办?当让是报oom错误了~但是一般来说不会出现这么爆满的情况,99%的对象都是临时的
永久区
这个区域常驻内存的。用来存放JDK自身携带的Class对象。Interface元数据,存储的是Java运行时的一些环境或类信息~说白了就是放JDK的各种包的,这里永不GC,你给GC了我用什么(笑)
这个区域不存在垃圾回收!关闭VM虚拟就会释放这个区域的内存~
jdk1.6之前︰永久代,常量池是在方法区;
jdk1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
jdk1.8之后∶无永久代,常量池在元空间
什么情况下永久区会崩?
一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断的被加载。直到内存满,就会出现OOM;
结构图(示意图)
代码输出一下JVM的最大内存和总内存
public class Test {
public static void main(String[] args) {
//JVM的最大内存
Long MAX = Runtime.getRuntime().maxMemory();//以字节为单位,换算兆为1024*1024
System.out.println("JVM的最大内存"+MAX/(1024*1024)+"Mb");
//JVM的总内存
Long TOTAL = Runtime.getRuntime().totalMemory();
System.out.println("JVM的总内存"+TOTAL/(1024*1024)+"Mb");
}
}
JVM的最大内存3605Mb
JVM的总内存243Mb
分配的总内存是电脑内存的 1/4,而初始化的内存: 1/64
前面提到了,JVM调优主要就是针对JVM的堆进行调试的,所以要调试他的堆
配置方式
在idea开发环境中修改,JVM参数,修改方式如下图:
那一栏里就是命令可以设置堆大小
假设代码:-Xms1024m -Xmx1024m -XX :+PrintGCDetails
有了这个PrintGCDetails,就可以输出GC日记
输出结果,就可以看到GC的过程记录
设置JVM内存的参数有四个:
-Xmx Java Heap最大值,默认值为物理内存的1/4,最佳设值应该视物理内存大小及计算机内其他内存开销而定;
-Xms (也就是最小值)Java Heap初始值,Server端JVM最好将-Xms和-Xmx设为相同值,开发测试机JVM可以保留默认值;
-Xmn Java Heap Young区(年轻区包含Eden和两个Survivor区)大小,不熟悉最好保留默认值;
-Xss 每个线程的Stack大小,不熟悉最好保留默认值;
-XXSurvivorRatio:年轻代中Eden区与Survivor区的大小比值年轻代5120m, Eden:Survivor=3,Survivor区大小=1024m(Survivor区有两个,即将年轻代分为5份,每个Survivor区占一份),总大小为2048m。
-Xms初始堆大小即最小内存值为10240m
XXSurvivorRatio=3,即Eden:FromSurvivor:To Survivor=3:1:1;所以Survivor一共是2048
面试官肯定要问,你遇到过OOM吗?答肯定是有,假装我遇到过~
结局方案
1、尝试扩大堆内存看结果(扩大了还满就是代码的问题)
2、分析内存,看一下哪个地方出现了问题(专业工具)
//-Xms1024m -Xmx1024m -XX :+PrintGCDetails
当新生代、老年代、元空间内存都满了之后才会报OOM
使用Jprofiler来解决OOM报错
在一个项目中,突然出现了OOM故障,那么该如何排除,研究为什么出错
能够看到代码第几行出错:内存快照分析工具,MAT(Eclipse专属),Jprofiler(IDEA专属)
Dubug,一行行分析代码!
MAT,Jprofiler作用:
分析Dump内存文件,快速定位内存泄露;
获得堆中的数据
获得大的对象
……
MAT最早集成于Eclipse中,IDEA中可以使用Jprofiles插件,在Settings—>Plugins中搜索Jprofiles,安装改插件即可使用
在idea中下载 jprofile 插件
百度搜索官网下载 jprofile 客户端 ,安装路径要求:没有中文没有空格
安装破解完之后,在IDEA的Settings—>Tools下找到 jprofiles,然后绑定安装目录bin下的.exe文件
在idea中VM参数中写参数 -Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError (假如堆内存heap出现了OOM则dump出这个异常)
运行程序后在jprofile客户端中打开(dump出的文件应该在src目录下)找到错误 告诉哪个位置报错
命令参数详解
-Xms设置初始化内存分配大小(也就是最小值),默认1/64内存大小 要带单位
-Xmx设置最大分配内存,默以1/4内存大小 要带单位
-Xmn设置年轻代内存大小 要带单位
-XX: +PrintGCDetails // 打印GC垃圾回收信息
-XX: +HeapDumpOnOutOfMemoryError //在OOM异常出现时生成Dump内存快照文件,我好debug用
-XXSurvivorRatio:年轻代中Eden区与Survivor区的大小比值(Survivor区有两个,即将年轻代分为5份,伊甸园3份,两个幸存区0,1各一份)。假设设置的-XXSurvivorRatio=3,即可以推算出
Eden(新生代伊甸园区) :From Survivor(幸存者0区) :To Survivor(幸存者1区)=3:1:1
平摊下来,每个Survivor区就是1/5的年轻区内存,所有Survivor区加在一起就是2/5的年轻区内存
面试题:
年轻代5120m, Eden:Survivor=3,Survivor区大小=1024m(Survivor区有两个,即将年轻代分为5份,每个Survivor区占一份),总大小为2048m。
-Xms初始堆大小即最小内存值为10240m
其最小内存值和Survivor区总大小分别是多少?()
答案:最小内存值10240m,Survivor大小:2048m
-Xms初始堆大小即最小内存值为10240m
XXSurvivorRatio=3,即Eden :From Survivor :To Survivor=3:1:1;所以Survivor一共是2048
JVM将堆分成了两个大区:新生代(Young)和老年代(Old),新生代又被进一步划分为Eden和Survivor区,其中Young区划分为Eden、Survivor1、Survivor2这三块,请问JVM的hotspot虚拟机三块默认分配的比例各是多少?答:(8:1:1)
在windows资源管理器下,打开Dump文件(jprofile自动打开),里面各种内容就都会有,对象大小等等,就可以着手对代码进行修正
GC垃圾回收
前情回顾GC的区域在哪里(方法区+堆)
JVM在进行GC时,并不是对这三个区域统一回收。大部分时候,回收都是新生代~
- 新生代
- 幸存区(
form
,to
) from是原来的幸存者0区 to是原来的幸存者1区两个区域动态转换谁空谁是to
- 老年区
GC两种类:轻GC(普通的GC),重GC(全局GC)
幸存0区和幸存1区两者是会交替的,from和to的关系会交替变化。
回顾GC题目
- JVM的内存模型和分区,详细到每个区放什么?
vm内存模型按照线程分可分为线程私有和线程共享两种.
线程私有 本地方法栈,虚拟机栈,程序计数器.
线程共享 堆,方法区(GC主要发生在这个区域)
首先本地方法栈:
本地方法栈放的就是本地方法的栈帧,这种方法一般是由c语言底层写的.通过JNI调用
虚拟机栈:
它是以栈帧为单位存储的.栈帧中包含方法索引,输入输出参数,局部变量八大基本类型,操作数栈,动态链接,父帧,子帧.
堆
堆是线程共享,存储的是对象以及数组实例,引用在方法栈中.
方法区
方法区主要存储的是类信息包括方法信息,字段信息,类名,并不是类实例,静态变量常量,运行时常量池等等.
pc寄存器
因为pc寄存器是线程独占的,所以每个线程都有一个寄存器.他不会发生内存溢出的情况因为他不会因为程序的执行而改变寄存器中数据所占的空间.
-
堆里面的分区有哪些? Eden,from,to,老年区,说说他们的特点!
堆内分为两个区域,年轻区 老年区
年轻区的内存大小设置:-Xmn +内存大小带单位
年轻区包括三个区域:Eden(伊甸园区,大部分的对象生成都在此处)、from区(幸存者0区)、to区(幸存者1区)两个幸存者区是动态转换,两个幸存区谁空谁就是to
。并且在GC发生的时候,轻GC大部分在此。经历过多次
轻GC的对象会移动到老年区内。年老代里存放的都是存活时间较久的,大小较大的对象,当年老代容量满的时候,会触发一次重GC(full GC),回收年老代和年轻代中不再被使用的对象资源。 -
GC的算法有哪些? 标记清除法,标记压缩,复制算法,引用计数器,怎么用的?
-
轻GC和重GC分别在什么时候发生?
轻GC一般发生在年轻区(Eden、From、to)这三个区域中任意区域满了的时候都可能触发轻GC
重GC一般发生在整个堆的空间,对于年轻区和老年区中不用的对象(没有引用对象)回收掉。
引用计数法
这个方法并不好,JVM现在不常用这个,计数器看哪个对象用的很少了,就GC掉,但是这个统计过程中,也会造成一定消耗,所以不常用。
复制算法
to永远是干净的,空的。from和to不断转换,假设两个都有东西,就把其中任意一个幸存区内的对象复制出来一份交给另一个幸存区,保证有一个空间完全干净,这就是复制算法。
新生区主要是用复制算法
第一次GC后:
第一次GC后,Eden区和to区空了,经过15次垃圾回收后依然存活下来的对象就会去养老区
好处:没有内存的碎片
坏处:浪费了内存空间(一个幸存区的空间永远是空:to)。假设对象100%存活(极端情况)
复制算法最佳使用场景:对象存活度较低的时候;新生区~
对于这种浪费了一块内存空间的算法,提出了优化的办法——标记清除算法
标记清除算法
- 优点:不需要额外的空间!
- 缺点:两次扫描,严重浪费时间,会产生内存碎片。
改良:标记清除再压缩(多了一个压缩过程,比上面那个好一丢丢,不浪费了)
因为压缩的成本很高,所以可以先标记清除多次,产生了较多的空闲区域,再对内存进行压缩处理(多次GC再合并)
GC算法总结
- 内存效率:复制算法(一次搞定)>标记清除算法(两次搞定)>标记压缩算法(多次)(次数代表时间复杂度)
- 内存整齐度:复制算法=标记压缩算法>标记清除算法
- 内存利用率:标记压缩算法=标记清除算法>复制算法
思考一个问题:难道没有最优算法吗?
答案:没有,没有最好的算法,只有最合适的算法 —> GC:分代收集算法
年轻代:
- 存活率低
- 复制算法!
老年代:
- 区域大:存活率高
- 标记清除 (内存碎片不是太多) + (碎片到达一定量后启动)标记压缩混合实现
JMM
什么是JMM?
JMM:(Java Memory Model的缩写)
它干嘛的? 官方,其他人的博客,对应的视频!
作用:缓存一致性协议,用于定义数据读写的规则 (遵守,找到这个规则)。
JMM定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)
解决共享对象可见性这个问题: volilate
一旦刷新了就会很快的同步到主内存中。
它该如何学习?
JMM:抽象的概念,理论
JMM对这八种指令的使用,制定了如下规则:
-
不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须
write -
不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
-
不允许一个线程将没有assign的数据从工作内存同步回主内存
-
一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是对变量实施use、store操作之前,必须经过assign和load操作
-
一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
-
如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
-
如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量对
-
一个变量进行unlock操作之前,必须把此变量同步回主内存
JMM对这八种操作规则和对volatile的一些特殊规则就能确定哪里操作是线程安全,哪些操作是线程不安全的了。但是这些规则实在复杂,很难在实践中直接分析。所以一般我们也不会通过上述规则进行分析。更多的时候,使用java的happen-before规则来进行分析。