Java内存区域与内存溢出异常

最新推荐文章于 2024-10-12 22:13:45 发布

饭磊

最新推荐文章于 2024-10-12 22:13:45 发布

阅读量114

点赞数

分类专栏：深入理解java虚拟机文章标签： jvm 内存区域溢出异常

本文链接：https://blog.csdn.net/qq_27113771/article/details/81057352

版权

深入理解java虚拟机专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Java虚拟机在执行Java程序的过程中会把他所管理的内存划分为若干个不同的数据区域。了解这些区域可以为接下来的学习打好基础。

一、运行时数据区域

1.程序计数器

程序计数器（Program Counter Register）是一块较小的内存空间，它可以看作是当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令，分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

每条线程都有一个独立的程序计数器，各线程之间互不影响，存储独立。

如果线程正在执行的是一个Java方法，这个计数器记录的是正在执行的虚拟机字节码指令的地址；如果是Native方法，这个计数器值则为空（Undefined）。

2.Java虚拟机栈

Java虚拟机栈是线程私有的，他的生命周期与线程相同。虚拟机栈描述的是 Java方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧（Stack Frame）用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程，就对应这一个栈帧在虚拟机栈中入栈到出栈的过程。

局部变量表存放了编译器可知的各种基本数据类型（boolean、byte、char、short、int、float、long、double）、对象引用（reference类型）和returnAddress类型（指向了一条字节码指令的地址）。

long和double类型的数据会占用2个局部变量空间（slot），其余的数据类型只占用1个。

3.本地方法栈

本地方法栈（Native Method Stack）与虚拟机栈是类似的，他们之间的区别不过是虚拟机栈为虚拟机执行Java方法（也就是字节码）服务，而本地方法栈则为虚拟机使用到的Native方法服务。

4.Java堆

Java堆（Java Heap）是被所有线程共享的一块内存区域，在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例，但随着技术的发展不是所有的对象实例都存储于Java堆。

Java堆是垃圾处理器管理的主要区域，因此有时候也被称为"GC堆"（Garbage Collected Heap）。由于现在收集器基本都采用分代收集算法，所以Java堆还可以细分为：新生代和老年代，再细致一点的有Eden空间、From Survivor空间、To Survivor空间等。从内存分配的角度来看，线程共享的Java堆中可能划分出多个线程私有的分配缓冲区（Thread Local Allocation Buffer，TLAB）。

5.方法区

方法区（Method Area）与Java堆一样，是各个线程共享的内存区域，它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。方法区描述为堆的一个逻辑部分，为了区分Java堆，所以它叫做Non-Heap（非堆）。

对于开发者来说更愿意把方法区称为：“永久代”（Permanent Generation），方法区是JVM的规范，永久代是方法区的实现两者并不等价，仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展到方法区，或者说使用永久代来实现方法区而已。这样HotSpot的垃圾收集器可以向管理Java堆一样管理这部分内存（注意方法区也是需要回收内存的），省去专门为方法区编写内存管理代码的工作。使用永久代来实现方法区容易发生内存溢出问题。

JDK8的元空间的本质和永久代类似，都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于：元空间并不在虚拟机中，而是使用本地内存。

元空间相对于永久代的好处：

1）字符串等信息存在永久代中容易内存溢出。

2）永久代需要指定空间大小但是类及方法信息大小难以确定。

3）永久代会为GC带来不必要的复杂度，并且回收效率偏低。

6.运行时常量池

运行时常量池（Runtime Constant Pool）是方法区的一部分。用于存放编译器生成的各种字面量（Literal）和符号引用（Symbolic References），这部分内容将在类加载后进入方法区的运行时常量池中存放。

1）字面量比较接近于Java语言层面的常量概念，如文本字符串、声明为final的常量值等。

2）符号引用则属于编译原理方面的概念，包括下面三类常量：

类和接口的全限定名（Fully Qualified Name）
字段的名称和描述符（Descriptor）
方法的名称和描述符

7.直接内存

直接内存（Direct Memory）并不是虚拟机运行时数据区的一部分，也不是java虚拟机规范中定义的内存区域。但是这部分内存也被频繁地使用，而且也可能导致OutOfMemoryError异常出现。

在JDK1.4中新加入了NIO类，引入了一种基于通道（Channel）与缓冲区（Buffer）的I/O方式，它可以使用Native函数库分配堆外内存，然后通过一个存储在java堆中的DirectByteBuffer对象作为这内存的引用进行操作。这样能在一些场景中显著提高性能，因为避免了在java堆和Native堆来回复制数据。

栈、堆和方法区之间的关系梳理：

堆中存储类加载器生成的class对象，方法区存储类的字节码，栈则保存指令用来描述执行顺序。栈中的reference类型只想堆中的对象地址，堆中的对象地址指向方法区中对应的类信息的地址（采用的是直接指针访问）。

二、hotspot虚拟机对象探秘

1.对象的创建

虚拟机遇到一条new指令时，首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用，并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有，那必须先执行相应的类加载过程。

在类加载检查通过后，接下来虚拟机将为新生对象分配内存。

1）指针碰撞：假设java堆中内存是绝对规整的，所有用过的内存都放在一边，空闲的内存放在另一边，中间放着一个指针作为分界点的指示器，那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。

2)空闲列表：如果java堆中的内存并不是规整的，已使用的内存和空闲的内存互相交错，那就没有办法简单进行指针碰撞了，虚拟机就必须维护一个列表，记录上哪些内存块是可用的，在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的记录。

在使用Serial、ParNew等待Compact（压缩）过程的收集器时，系统采用的分配算法是指针碰撞，而使用CMS这种基于Mark-Sweep(标记-清除)算法的收集器时，通常采用空闲列表。

修改指针分配位置分配内存不是线程安全的，解决这种问题有两种方案：

1）对分配内存空间的动作进行同步处理——实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性；

2）把内存分配的动作按照线程划分在不同的空间之中进行，即每个线程在java堆中预先分配一小块内存，称为本地线程分配缓冲（Thread Local Allocation Buffer）TLAB。哪个线程要分配内存，就在哪个线程的TLAB上分配，只有TLAB用完并分配新的TLAB时，才需要同步锁定。

内存分配完成后，虚拟机需要将分配到的内存空间都初始化为零值（不包括对象头）。这一步操作保证了对象的实例字段在java代码中可以不赋初始值就直接使用，程序能访问到这些字段的数据类型所对应的零值。

接下来，虚拟机要对对象进行必要的设置，例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分带年龄等信息。

在上面工作都完成之后，从虚拟机的视角来看，一个新的对象已经产生了，但从java程序的视角来看，对象创建才刚刚开始——<init>方法还没执行，所有的字段都还为零。所以，一般来说（由字节码中是否跟随invokespecial指令所决定），执行new指令之后会接着执行<init>方法，把对象按照程序员的意愿进行初始化。

其实上面讲的一大堆过程包含了很多知识点，后面会慢慢细讲，现在只需要记住下面的过程即可。

简易过程图：

new——>在常量池查找并检查类是否加载——>分配内存——>初始化内存空间为零值——>对对象进行必要设置——>执行<init>方法

用专业名词：

new——>在常量池查找并检查类是否加载——>类加载过程（加载——>{验证——>准备——>解析}这三个过程通称为连接——>初始化）

2.对象的内存布局

在HotSpot虚拟机中，对象在内存中存储的布局可以分为3块区域：对象头（Header）、实例数据（Instance Data）和对齐填充（Padding）。

对象头包括两部分信息，第一部分用于存储对象自身的运行时数据：

这部分数据的长度在32位和64位的虚拟机（未开启压缩指针）中分别为32bit和64bit，官方称它为“Mark Word”。Mark Word被设计成一个非固定的数据结构以便在绩效的空间内存储尽量多的信息，它会根据对象的状态复用自己的存储空间。

对象的另一部分是类型指针，即对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象是哪个类的实例。

接下来的实例数据部分是对象真正存储的有效信息，也是在程序代码中所定义的各种类型的字段内容。

3.对象的访问定位