JVM入门学习

最新推荐文章于 2022-02-01 20:53:39 发布

勿⊙言

最新推荐文章于 2022-02-01 20:53:39 发布

阅读量199

点赞数

分类专栏： jvm 文章标签： jvm java

本文链接：https://blog.csdn.net/weixin_43212172/article/details/108420718

版权

jvm 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、JVM体系结构概览

Java体系结构图

二、类加载器ClassLoader

1、什么是加载器？
原理：负责加载class文件，class在文件开头有特定的文件标示，将class文件字节码内容加载到内存中，并将这些内容转换成方法区中的运行时数据结构并且ClassLoader只负责class文件的加载，至于它是否可以运行，则Execution Engine决定。其实，通俗点讲ClassLoader类似显示生活中的快递员。

2、有几种加载器？
虚拟机自带的加载器
1）启动类加载器（Bootstrap） C++
2）扩展类加载器（Extension） Java
3）应用类加载器（AppClassLoader） Java也叫系统类加载器，加载当前应用的classpath的所有类

用户自定义加载器
Java.lang.ClassLoader的子类，用户可以定制类的加载方式

3、双亲委派机制：（小口诀：我爸是李刚，有事找我爹）
当一个类收到了类加载请求，他首先不会尝试自己去加载这个类，而是把这个请求委派给父类去完成，每一层次类加载器都是如此，因此所有的加载请求都应该传送到启动类加载其中，只有当父类加载器反馈自己无法完成这个请求的时候（在它的加载路径下没有找到所需加载的Class），子类加载器才会尝试自己去加载。
采用双亲委派机制的一个好处是比如加载器位于rt.jar包中的类java.lang.Object，不管是哪个加载器加载这个类，最终都是委托给顶层的启动类加载器进行加载，这样就保证了使用不同的类加载器最终得到的都是同一个Object对象。

4、沙箱安全机制

三、执行引擎Execution Engine

原理：Execution Engine执行引擎负责解释命令，提交操作系统执行。

四、本地方法接口Native Interface

本地方法接口的作用是融合不同的编程语言为Java所用，它的初衷是融合C/C++程序，Java诞生的时候是C/C++横行的时候，要想立足，必须有调用C/C++程序，于是就在内存中专门开辟了一块区域处理标记为native的代码，它的具体做法是Native Method Stack中登记native方法，在Execution Engine执行时加载native libraies。
目前该方法使用的越来越少，除非是与硬件有关的应用，比如通过Java程序驱动打印机或者Java系统管理生产设备，在企业级应用中已经比较少见。因为现在的异构领域间的通信很发达，比如可以使用Socket通信，也可以使用Web Service等等，不多做介绍。

五、本地方法栈Native Method Stack

它的具体做法是Native Method Stack中登记native方法，在Execution Engine执行时加载本地方法库。

六、程序计数器

PC寄存器（通俗讲：类似排班值日表）：
每个线程都有一个程序计数器，是线程私有的，就是一个指针，指向方法区中的方法字节码（用来存储指向下一条指令的地址，也即将要执行的指令代码），有执行引擎读取下一条指令，是一个非常小的内存空间，几乎可以忽略不计。
这块区域很小，它是当前线程所执行的字节码的行号指示器。字节码解释器通过改变这个计数器的值来选取下一条需要执行的字节码指令。
如果执行的是一个Native方法，那这个计数器是空的。
用以完成分支、循环、跳转、异常处理、线程恢复等基础功能。不会发生内存溢出（OutOfMemory=OOM）错误

七、方法区Method Area

供各线程共享的运行时内存区域。它存储了每一个类的结构信息（通俗点讲就是模板），例如运行时常量池（Runtime Constant Pool）、字段和方法数据、构造函数和普通方法的字节码内容。上面讲的是规范，在不同虚拟机里头实现是不一样的，最典型的就是永久代（PermGen space）和元空间（Metaspace）。
But
实例变量存在堆内存中，和方法区无关

JAVA7:方法区 f = new 永久代
JAVA8:方法区 f = new 元空间

八、Java栈（Java Stack）—栈管运行

栈也叫栈内存，主管Java程序的运行，是在线程创建时创建，它的生命期是跟随随线的生命期，线程结束栈内存也就释放，对于栈来说，不存在垃圾回收机制，只要线程一结束该栈就Over，生命周期和线程一致，是线程私有的。8种基本类型变量+对象的引用变量+实例方法都是在函数的栈内存中分配。

1、 栈存储什么？
栈帧（=Java方法）主要保存3类数据：
1）本地变量（Local Variables）：输入参数和输出参数以及方法内的变量；
2）栈操作（Operand Stack）：记录出栈、入栈的操作；
3）栈帧数据（Frame Data）：包括类文件、方法等等。

2、栈运行原理：
栈中的数据都是以栈帧（Stack Frame）的格式存在，栈帧是一个内存区块，是一个数据集，是一个有关方法（Method）和运行期数据的数据集，当一个方法A被调用时就产生一个栈帧F1，并被压入到栈中，A方法又调用了B方法，于是产生栈帧F2也被压入栈，B方法又调用了C方法，于是产生栈帧F3也被压入栈中，……
执行完毕后，先弹出F3栈帧，再弹出F2栈帧，再弹出F1栈帧……
遵循“先进后出”/“后进先出”原则。
每个方法执行的同时都会创建一个栈帧，用于存储局部变量表、操作数栈、动态链接、方法出口等信息，每一个方法从调用直至执行完毕的过程，就对应着一个栈帧在虚拟机入栈到出栈的过程。栈的大小和具体JVM的实现有关。通常在256K~756K之间，与等于1Mb左右。

简述：每执行一个方法都会产生一个栈帧，保存到栈（后进先出）的顶部，顶部栈就是当前的方法，该方法执行完毕后会自动将此栈帧出栈。

3、“java.lang.StackOverflowError”—SOF：
1）属于错误

九、堆（heap）—堆管存储

一）Heap 堆：
一个JVM实例只存在一个堆内存，堆内存的大小是可以调节的。类加载器读取了类文件后，需要把类、方法、常变量放到堆内存中，保存所有引用类型的真实信息，以方便执行器执行，堆内存分为三部分：

Young Generation Space 新生区 Young/New
Tenure Generation Space 老年区 Old/Tenure
Permanent Space 永久区 Perm

二）（Java7之前）堆内存逻辑上分为三部分：新生+养老+永久：
Java7堆内存逻辑划分图
三）Java堆从GC的角度还可以细分为：新生代（Eden区、From Survivor区和To Survivor区）和老年代
Java7堆内存GC划分图在这里插入图片描述
1：eden、SurvivorFrom复制到SurvivorTo，年龄+1
首先，当Eden区满的时候会触发第一次GC，把还活着的对象拷贝到SurvivorFrom区，当Eden区再次触发GC的时候会扫描Eden区和From区域，对这两个区域进行垃圾回收，经过这次回收后还存活的对象，则直接复制到To区域（如果有对象的年龄达到了老年的标准，则赋值到老年代），同时把这些对象的年龄+1

2：清空eden、SurvivorFrom
然后，清空Eden和SurvivorFrom中的对象，也即复制之后有交换，谁空谁是to

3：SurvivorTo和SurvivorFrom互换
最后，SurvivorTo和SurvivorFrom互换，原SurvivorTo成为下一次GC时的SurvivorFrom区。部分对象会在From和To区域中复制来复制去，如此交换15次（由JVM参数的MaxTenuringThreshold决定，这个参数默认是15），最终如果还是存活，就存入老年代

四）堆空间划分理解：
物理上堆空间：新生代和老年代
逻辑上堆空间：新生代、老年代、永久代/元空间

经研究，不同对象的生命周期不同，98%的对象时临时对象。

五、永久代和元空间介绍
永久区（Java7之前有）：
永久存储区是一个常驻内存区域，用于存放JDK自身所携带的 Class,Interface 的元数据，也就是说它存储的是运行环境必须的类信息，被装载进此区域的数据是不会被垃圾回收器回收掉的，关闭 JVM 才会释放此区域所占用的内存。

元空间（Java8之后有）：
在Java8中，永久代已经被移除，被一个称为元空间的区域所取代。元空间的本质和永久代似。

元空间与永久代之间最大的区别在于：
永久带使用的JVM的堆内存，但是java8以后的元空间并不在虚拟机中而是使用本机物理内存。

因此，默认情况下，元空间的大小仅受本地内存限制。类的元数据放入 native memory, 字符串池和类的静态变量放入 java 堆中，这样可以加载多少类的元数据就不再由MaxPermSize 控制, 而由系统的实际可用空间来控制。

十、堆-栈-方法区的交互关系

HotSpot
HotSpot是使用指针的方式来访问对象：Java堆中会存放访问类元数据的地址，reference存储的就直接是对象的地址。
在这里插入图片描述
实际而言，方法区（Method Area）和堆一样，是各个线程共享的内存区域，它用于存储虚拟机加载的：类信息+普通常量+静态常量+编译器编译后的代码等等，虽然JVM规范将方法区描述为堆的一个逻辑部分，但它却还有一个别名叫做Non-Heap(非堆)，目的就是要和堆分开。

对于HotSpot虚拟机，很多开发者习惯将方法区称之为“永久代(Parmanent Gen)” ，但严格本质上说两者不同，或者说使用永久代来实现方法区而已，永久代是方法区(相当于是一个接口interface)的一个实现，jdk1.7的版本中，已经将原本放在永久代的字符串常量池移走。

十一、堆内存调优

堆内存

GC流程图

十二、GC算法

一）GC是什么（分代收集算法）：
1）次数上频繁收集Young区（较小收集）
2）次数上较少收集Old区（较大收集）
3）基本不动Perm区

二）GC算法总体概述：Minor GC和Full GC的区别
普通GC（minor GC）：只针对新生代区域的GC，指发生在新生代的垃圾收集动作，因为大多数Java对象存活率都不高，所以Minor GC非常频繁，一般回收速度也比较快。
全局GC（major GC or Full GC）：指发生在老年代的垃圾收集动作，出现Major GC，经常会伴随至少一次的Minor GC（但不是绝对的）。Major GC的速度一般要比Minor GC慢上10倍以上

三）判断Java中对象存活的算法:
1.引用计数算法：引用计数器算法是给每个对象设置一个计数器，当有地方引用这个对象的时候，计数器+1，当引用失效的时候，计数器-1，当计数器为0的时候，JVM就认为对象不再被使用，是“垃圾”了。
引用计数器实现简单，效率高；但是不能解决循环引用问问题（A对象引用B对象，B对象又引用A对象，但是A,B对象已不被任何其他对象引用），同时每次计数器的增加和减少都带来了很多额外的开销，所以在JDK1.1之后，这个算法已经不再使用了。
2.根搜索方法：根搜索方法是通过一些“GCRoots”对象作为起点，从这些节点开始往下搜索，搜索通过的路径成为引用链（ReferenceChain），当一个对象没有被GCRoots的引用链连接的时候，说明这个对象是不可用的。
GCRoots对象包括：

虚拟机栈（栈帧中的本地变量表）中的引用的对象。
方法区域中的类静态属性引用的对象。
方法区域中常量引用的对象。
方法栈中JNI（Native方法）的引用的对象。

四）GC的4大算法：
1、复制算法：
年轻代中使用的是Minor GC（YGC），这种GC算法采用的是复制算法(Copying)。
Minor GC会把Eden中的所有活的对象都移到Survivor区域中，如果Survivor区中放不下，那么剩下的活的对象就被移到Old generation中，也即一旦收集后，Eden是就变成空的了。
当对象在 Eden ( 包括一个 Survivor 区域，这里假设是 from 区域 ) 出生后，在经过一次 Minor GC 后，如果对象还存活，并且能够被另外一块 Survivor 区域所容纳( 上面已经假设为 from 区域，这里应为 to 区域，即 to 区域有足够的内存空间来存储 Eden 和 from 区域中存活的对象 )，则使用复制算法将这些仍然还存活的对象复制到另外一块 Survivor 区域 ( 即 to 区域 ) 中，然后清理所使用过的 Eden 以及 Survivor 区域 ( 即 from 区域 )，并且将这些对象的年龄设置为1，以后对象在 Survivor 区每熬过一次 Minor GC，就将对象的年龄 + 1，当对象的年龄达到某个值时 ( 默认是 15 岁，通过-XX:MaxTenuringThreshold 来设定参数)，这些对象就会成为老年代。

因为年轻代中的对象基本都是朝生夕死的(90%以上)，所以在年轻代的垃圾回收算法使用的是复制算法。
复制算法的优点是不会产生内存碎片，缺点是耗费空间。

2、标记清除（Mark-Sweep）：
用通俗的话解释一下标记清除算法，就是当程序运行期间，若可以使用的内存被耗尽的时候，GC线程就会被触发并将程序暂停，随后将要回收的对象标记一遍，最终统一回收这些对象，完成标记清理工作接下来便让应用程序恢复运行。

主要进行两项工作，第一项则是标记，第二项则是清除。
标记：从引用根节点开始标记遍历所有的GC Roots，先标记出要回收的对象。
清除：遍历整个堆，把标记的对象清除。

缺点：此算法需要暂停整个应用，会产生内存碎片

3、标记压缩（Mark-Compact）：
用通俗的话解释一下标记压缩算法，就是将标记的对象滑动到一起，形成连续的存储空间。

主要进行两项工作，第一项则是标记，第二项则是清除。
标记：从引用根节点开始标记遍历所有的GC Roots，先标记出要滑动的对象。
压缩：遍历整个堆，把标记的对象压缩到一起，形成连续存储空间。

优点：没有内存碎片产生，可以利用bump
缺点：需要移动对象的成本

老年代一般是由标记清除或者是标记清除与标记整理的混合实现。
标记清除与标记整理的混合实现，称为标记压缩清除算法（Mark-Sweep-Compact），可将提高使用效率，但时间浪费过大。

4、分代收集算法：
当前商业虚拟机都是采用分代收集算法，它根据对象存活周期的不同将内存划分为几块，一般是把Java堆分为新生代和老年代，然后根据各个年代的特点采用最适当的收集算法，在新生代中，每次垃圾收集都发现有大批对象死去，只有少量存活，就选用复制算法，而老年代因为对象存活率高，没有额外空间对它进行分配担保，就必须使用“标记清理”或者“标记整理”算法来进行回收。