深入理解Java虚拟机（第3版）学习笔记——JAVA内存区域（超详细）

以终为始001

已于 2022-07-27 15:46:30 修改

阅读量416

点赞数

分类专栏： JVM 文章标签： java 学习 jvm

于 2022-07-24 14:07:16 首次发布

本文链接：https://blog.csdn.net/qq_53578500/article/details/125958546

版权

JVM 专栏收录该内容

8 篇文章 2 订阅

订阅专栏

深入理解Java虚拟机（第3版）学习笔记——JAVA内存区域（超详细）

运行时数据区域

java虚拟机在执行java程序的时候会把它所管理的内存分为若干个区域。每个区域都有各自的用途，以及各自的创建和销毁的时间。有的区域会依赖于线程的启动和结束而创建和销毁，而有些区域则一直存在。

程序计数器

程序计数器（Program Counter Register）是一块较小的内存空间，当前线程所执行的字节码的行号指示器。

字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令，它是程序控制流的指示器，分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

每条线程都需要有一个独立的程序计数器，各条线程之间计数器互不影响，独立存储，我们称这类内存区域为“线程私有”的内存。

如果线程正在执行的是一个Java方法，这个计数器记录的是正在执行的虚拟机字节码指令的地址；如果正在执行的是本地（Native）方法，这个计数器值则应为空（Undefined）。

java虚拟机栈

Java虚拟机栈（Java Virtual Machine Stack）也是线程私有的，它的生命周期与线程相同。

虚拟机栈描述的是Java方法执行的线程内存模型：每个方法被执行的时候，Java虚拟机都会同步创建一个栈帧用于存储局部变量表、操作数栈、动态连接、方法出口等信息。每一个方法被调用直至执行完毕的过程，就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

局部变量表存放了编译期可知的各种java虚拟机基本数据类型（八种基本数据类型）、对象引用（一个指向对象起始地址的引用指针或指向一个代表该对象的句柄或者其他与该对象有关的位置）和returnAddress类型（指向一条字节码指令的地址）

可能存在的两类异常情况：

栈深度溢出：如果线程请求的栈深度大于虚拟机所允许的深度，将抛出StackOverflowError异常；
栈扩展失败：如果Java虚拟机栈容量可以动态扩展，当栈扩展时无法申请到足够的内存会抛出OutOfMemoryError异常。

本地方法栈

本地方法栈（Native Method Stacks）与虚拟机栈所发挥的作用是非常相似的，其区别只是虚拟机栈为虚拟机执行Java方法（也就是字节码）服务，而本地方法栈则是为虚拟机使用到的本地（Native）方法服务。

java堆

概念：Java堆（Java Heap）是虚拟机所管理的内存中最大的一块。是所有线程共享的一块内存区域，在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例，Java 世界里==“几乎”==所有的对象实例都在这里分配内存。

值类型的数据存放在哪儿：“基本数据类型如果声明在方法内,那么它就存储在栈中,如果声明在类的成员或声明为static那么就存储在堆中。”

（由于即时编译技术的进步，尤其是逃逸分析技术的日渐强大，栈上分配、标量替换优化手段已经导致一些微妙的变化悄然发生，所以说Java对象实例都分配在堆上也渐渐变得不是那么绝对了。）

Java堆也是垃圾收集器管理的内存区域。里面存在的一些区域划分仅仅是一部分垃圾收集器的共同特性或者说设计风格而已，并不是真正意义上的固有内存布局。

Java堆中可以划分出多个线程私有的分配缓冲区（Thread Local Allocation Buffer，TLAB），以提升对象分配时的效率。将Java堆细分的目的只是为了更好地回收内存，或者更快地分配内存。

Java堆可以处于物理上不连续的内存空间中，但在逻辑上它应该被视为连续的。对于大对象（典型的如数组对象），多数虚拟机实现出于实现简单、存储高效的考虑，很可能会要求连续的内存空间。

可能存在的异常情况：

堆内存溢出：如果在Java堆中没有内存完成实例分配，并且堆也无法再扩展时，Java虚拟机将会抛出OutOfMemoryError异常。
通过参数-Xmx（堆内存的最大大小）和-Xms（堆内存的初始大小）设定

方法区

线程共享的内存区域，它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。

如何实现方法区属于虚拟机实现细节：常见的永久代、元空间。

使用永久代来实现方法区更容易导致内存溢出（永久代有-XX：MaxPermSize的上限，即使不设置也有默认大小，，而J9和JRockit只要没有触碰到进程可用内存的上限，例如32位系统中的4GB限制，就不会出问题）。

在JDK6的时候，逐步改为采用本地内存（Native Memory）来实现方法区，到了JDK7的HotSpot，已经把原本放在永久代的字符串常量池、静态变量等移到堆中，而到了 JDK 8，终于完全废弃了永久代的概念，改用与JRockit、J9一样在本地内存中实现的元空间（Metaspace）来代替，把JDK 7中永久代还剩余的内容（主要是类型信息）全部移到元空间中。

方法区和堆一样不需要连续的内存空间以及可扩展，甚至方法区还可以选择不实现垃圾收集。这区域的内存回收目标主要是针对常量池的回收和对类型的卸载

运行时常量池

运行时常量池（Runtime Constant Pool）是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外，还有一项信息是常量池表（Constant Pool Table），用于存放编译期生成的各种字面量与符号引用，这部分内容将在类加载后存放到方法区的运行时常量池中。

一般来说运行时常量池除了保存Class文件中描述的符号引用外，还会把由符号引用翻译出来的直接引用也存储在运行时常量池中。

运行时常量池具有动态性，不一定只有在编译期才能产生，运行期间也可以将新的常量放入池中，利用的较多的是String类的 intern()方法。（jdk1.6开始）

可能存在的异常情况：

运行时常量池是方法区的一部分，自然受到方法区内存的限制，当常量池无法再申请到内存时会抛出OutOfMemoryError异常。

直接内存

直接内存（Direct Memory）并不是虚拟机运行时数据区的一部分。

在JDK 1.4中新加入了NIO（New Input/Output）类，引入了一种基于通道（Channel）与缓冲区（Buffer）的I/O方式，它可以使用Native函数库直接分配堆外内存，然后通过一个存储在Java堆里面的 DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能，因为避免了在Java堆和Native堆中来回复制数据。

不会受到java堆大小的限制，而会受到本机总内存的限制。（分配各区域大小时考虑各个区域之和大于物理内存限制）

对象的创建

类加载检查：遇到字节码new指令后，检查这个指令的参数能否在常量池中定位到一个类的符号应用。如果没有，那必须执行相应的类加载过程。
为对象分配内存：类加载检查通过后，利用空闲指针法或者空闲列表法将一块确定大小的内存块（与对象的大小相同）从java堆中划分出来。（其中使用CAS或者TLAB来保证线程安全性）
赋初值：内存分配完毕过后，将这些内存空间中的变量都初始化零值。（这步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用，使程序能访问到这些字段的数据类型所对应的零值）
对象标识：将对象的类实例信息、如何找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息都存放在对象的对象头中。
开始方法：对象标识结束后，从java程序看对象创建才刚刚开始——进入构造函数按照业务逻辑进行对象的构造。

空闲指针法：堆中空闲的区域和非空闲的区域分别放在堆的两边，中间放着一个指针作为分界节点的指示器。分配内存时，只需要将指针往空闲方向的区域移动与对象大小相等的距离即可。

空闲链表法：虚拟机维护一个列表，记录那些内存块是可用的，在分配内存的时候找到一块足够大的内存给对象，并更新列表的记录。

选择哪种分配方式由Java堆是否规整决定，而Java堆是否规整又由所采用的垃圾收集器是否带有空间压缩整理（Compact）的能力决定。

对象的内存布局

对象在堆内存中的存储布局可以划分为三个部分：对象头（Header）、实例数据（Instance Data）和对齐填充（Padding）。

对象头

主要存储两类信息：对象自身的运行时数据、类型指针。

存储对象自身的运行时数据：如哈希码（HashCode）、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。

这部分数据的长度在32位和64位的虚拟机（未开启压缩指针）中分别为32个比特和64个比特。官方称它为==“Mark Word”==。

考虑到虚拟机的空间效率，Mark Word被设计成一个有着动态定义的数据结构，以便在极小的空间内存储尽量多的数据，根据对象的状态复用自己的存储空间。

存储对象自身的类型指针：Java虚拟机通过这个指针来确定该对象是哪个类的实例（并不是所有的虚拟机实现都必须在对象数据上保留类型指针，换句话说，查找对象的元数据信息并不一定要经过对象本身）。

如果是对象是一个java数组，则还需要在对象头中记录数组长度的数据，因为要通过这个数据来计算数组对象的大小。

实例数据

实例数据部分是对象真正存储的有效信息，即我们在程序代码里面所定义的各种类型的字段内容，无论是从父类继承下来的，还是在子类中定义的字段都必须记录起来。

字段存储顺序会受到虚拟机分配策略参数（-XX：FieldsAllocationStyle参数）和字段在Java源码中定义顺序的影响。

相同宽度的字段总是被分配到一起存放，在满足这个前提条件的情况下，在父类中定义的变量会出现在子类之前。如果HotSpot虚拟机的 +XX：CompactFields参数值为true（默认就为true），那子类之中较窄的变量也允许插入父类变量的空隙之中，以节省出一点点空间。

HotSpot虚拟机默认的分配顺序为longs/doubles、ints、shorts/chars、bytes/booleans、oops（Ordinary Object Pointers，OOPs）

对齐填充

仅仅起着占位符的作，任何对象的大小都必须是8字节的整数倍。因此，如果对象实例数据部分没有对齐的话，就需要通过对齐填充来补全。

对象的访问定位

创建对象自然是为了后续使用该对象，我们的Java程序会通过栈上的reference数据来操作堆上的具体对象。

reference类型：规定它只是一个指向对象的引用。

两种访问方式（主要是使用直接指针访问方式）：

句柄访问：Java堆中将可能会划分出一块内存来作为句柄池，reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自具体的地址信息
直接指针访问：reference中存储的直接就是对象地址，如果只是访问对象本身的话，就不需要多一次间接访问的开销

各自的好处：

使用句柄来访问的最大好处就是reference中存储的是稳定句柄地址，在对象被移动（垃圾收集时移动对象是非常普遍的行为）时只会改变句柄中的实例数据指针，而 reference本身不需要被修改。

使用直接指针来访问最大的好处就是速度更快，它节省了一次指针定位的时间开销。

String.intern()返回引用的测试

public class RuntimeConstantPoolOOM {
    public static void main(String[] args) {
        String str1 = new StringBuilder("计算机").append("软件").toString();
        System.out.println(str1.intern() == str1);
        String str2 = new StringBuilder("ja").append("va").toString();
        System.out.println(str2.intern() == str2);
    }
}

这段代码在JDK 6中运行，会得到两个false，而在JDK 7中运行，会得到一个true和一个false。

在JDK 6中，intern()方法会把首次遇到的字符串实例复制到永久代的字符串常量池中存储，返回的也是永久代里面这个字符串实例的引用，而由StringBuilder创建的字符串对象实例在 Java堆上，所以必然不可能是同一个引用，结果将返回false。

而JDK 7的intern()方法实现就不需要再拷贝字符串的实例到永久代了，既然字符串常量池已经移到Java堆中，那只需要在常量池里记录一下首次出现的实例引用即可，因此intern()返回的引用和由StringBuilder创建的那个字符串实例就是同一个。而对str2比较返回false，这是因为“java” 这个字符串在执行String-Builder.toString()之前就已经出现过了，字符串常量池中已经有它的引用，不符合intern()方法要求“首次遇到”的原则，“计算机软件”这个字符串则是首次出现的，因此结果返回true。