Java内存区域与内存溢出异常

 

运行时数据区域

Java虚拟机在执行Java程序时,会把它管理的内存划分为若干个不同的数据区。这些区域有不同的特性,起不同的作用。它们有各自的用途、创建时间、销毁时间。有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户线程的启动和结束而建立和销毁。

1、程序计数器

    程序计数器(Program Counter Register)是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

    由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存

    如果线程正在执行的是一个Java方法,计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,计数器值则为(Undefined)。

    此内存区域是唯一一个在Java虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域。

2、Java虚拟机栈

    Java虚拟机栈(Java Virtual Machine Stacks)也是线程私有的,生命周期与线程相同,描述的是Java方法执行的内存模型:每个方法在执行同时会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。

    每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

    局部变量表存放的数据:

  • 编译期可知的各种基本数据类型(64位长度的 long 和 double 类型的数据会占用2个局部变量空间,其余数据类型占1个)
  • 对象引用(reference类型,不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的操作)
  • returnAddress类型(指向了一条字节码指令的地址)

    局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小

    栈帧结构如下:

    两种异常状况:

  • StackOverflowError:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常
  • OutOfMemoryError:如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常

3、本地方法栈

    本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是十分相似的,他们之间的区别不过是虚拟机栈为Java方法字节码服务,而本地方法栈则Native方法服务。在虚拟机规范中对本地方法使用的语言和使用方法与数据结构没有强制规定,因此具体的虚拟机可以自由实现它。Sun HotSpot虚拟机把本地方法栈和虚拟机栈合二为一。和虚拟机栈一样,本地方法栈也会抛出OutOfMemoryError 和 StackOverflowError异常。

4、Java堆

    堆(heap)是虚拟机中最大的一块内存区域,线程共享,在虚拟机启动时创建,目的是存放对象实例,几乎所有对象实例都在这里分配内存,但随着JIT编译器的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换等优化技术会导致一些微妙的变化,所有对象都分配在堆上也不是那么绝对了。

  逃逸分析技术:

  • 同步消除:如果一个对象/变量只能被一个线程被访问到,那么对于这个对象/变量的操作可以不考虑同步措施。
  • 栈上分配:如果一个对象不会逃逸出方法之外,可以考虑将对象在栈上分配内存,对象所占用的内存空间就可以随栈帧出栈而销毁。
  • 标量替换:有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在栈上或者CPU寄存器中。

    Java堆是垃圾收集器管理的主要区域,因此也被成为‘GC’堆(Garbage Collected Heap)

    Java堆分类:

  • 从垃圾回收的角度来讲,现在的收集器包括HotSpot都采用分代收集算法,所以堆又可以分为:新生代(Young)和老年代(Tenured),再细致一点,新生代又可分为Eden、From Survivor空间和To Survivor空间。
  • 从内存分配的角度来讲,又可以分为若干个线程私有的分配缓冲区(Thread Local Allocation Buffer ,TLAB)。

    无论哪个如何划分,都与存放内容无关,无论哪个区域,存储的都依然是对象实例,进一步划分的目的是为了更好地回收内存,或者更快地分配内存。同时,Java堆可以处于物理上不连续的内存空间,只要逻辑连续即可。

    如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,会抛出OutOfMemoryError异常。

5、方法区

       方法区和Java堆一样,是各个线程共享的内存区域,用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译后的代码等数据。

       方法区有个别名叫做非堆Non-Heap。对于HotSpot开发者来说,很多人称它为“永久代”(Permanent Generation),但是两者并不等价,仅仅是因为HotSpot虚拟机设计团队把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已,这样HotSpot的垃圾收集器可以向管理堆一样管理这部分内存。但是因为永久代有“-XX:MaxPermSize的上限,使其更容易内存溢出。因此在JDK1.7的HotSpot中,已经把原本放在永久代的字符串常量池移出去了。

     相对而言,垃圾收集行为在这个区域是比较少出现的,但并非输出进入了方法区就如永久代的名字一样"永久"存在了,这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说,这个区域的回收率不高,尤其是对类型的卸载,条件相当苛刻,但是这个区域的回收却是必要的。

     当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

补充:PermGen

     HotSpot JVM中,永久代中用于存放类和方法的元数据以及常量池。每当一个类初次被加载的时候,它的元数据都会被放到永久代中。

    永久代大小有限制,如果加载的类太多,很可能导致永久代内存溢出,即java.lang.OutOfMemoryError: PermGen。

    Java 8中PermGen被移出HotSpot JVM了:

  • 由于 PermGen 内存经常会溢出,引发恼人的 java.lang.OutOfMemoryError: PermGen,因此 JVM 的开发者希望这一块内存可以更灵活地被管理,不要再经常出现这样的 OOM
  • 移除 PermGen 可以促进 HotSpot JVM 与 JRockit VM 的融合,因为 JRockit 没有永久代

    PermGen最终被移出,方法区移至Metaspace,中文名叫元空间,如果Metaspace的空间占用达到了设定的最大值,那么就会触发GC来收集死亡对象和类的加载器。

6、运行时常量池

     运行时常量池是方法区的一部分。Class文件除了有类别版本,字段,方法,接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

    一般来说,除了保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中。

    运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用得比较多的便是String类的 intern() 方法。

    受方法区内存的限制,当常量池无法申请内存时就会抛出OutOfMemoryError

补充:Class文件常量池、运行时常量池、字符串常量池

    在JDK1.7之前运行时常量池逻辑包含字符串常量池存放在方法区, 此时hotspot虚拟机对方法区的实现为永久代

    在JDK1.7 字符串常量池被从方法区拿到了堆中, 这里没有提到运行时常量池,也就是说字符串常量池被单独拿到堆,运行时常量池剩下的东西还在方法区, 也就是hotspot中的永久代

    在JDK1.8 hotspot移除了永久代用元空间(Metaspace)取而代之, 这时候字符串常量池还在堆, 运行时常量池还在方法区, 只不过方法区的实现从永久代变成了元空间(Metaspace)

7、直接内存

    直接内存(Direct Memory)不属于虚拟机中定义的内存区域,而是堆外内存。

    JDK1.4 中新加入了NIO(new Input/Output)类,引入了一种基于通道(Channel)和缓冲区(Buffer)的I/O方式,它可以使用Native函数直接分配堆外内存,然后通过Java堆中的DirectByteBuffer对象作为这快内存的引用进行操作。这样能在一些场景中显著提高新能性能,避免了在Java堆和Native堆中来回复制数据。

    各个内存区域总和大于物理内存限制,会导致动态扩展时出现OutOfMemoryError异常。

HotSpot虚拟机对象探秘

1、对象的创建

在语言层面上,对象的创建只不过是一个new关键字而已,那么在虚拟机中又是一个怎样的过程呢?

一、判断类是否加载。

     虚拟机遇到一条new指令的时候,首先会去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号代表的类是否被加载、解析和初始化过。如果没有完成这个过程,则必须执行相应类的加载过程。

二、在堆上为对象分配空间。

    对象需要的空间大小在类加载完成后便能确定,之后便是在堆上为该对象分配空间,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来,分配的方式也有两种:

  • 假设Java内存中的堆都是规整的,所有用过的内存都放在一边,空闲的内存放在一边,中间放着一个指针作为分界点的指示器,那分配内存只需把作为使用和未使用空间的分界点的指针移动一段距离就可以了。这种分配方式成为“指针碰撞”。
  • 如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表来记录内存的使用情况,记录哪些内存块是可以使用的,在分配时从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式叫做“空闲列表”
  • 在使用Serial、ParNew等带Compact过程的收集器时,系统采用的分配算法是指针碰撞
  • 使用CMS这种基于Mark-Sweep算法的收集器时,通常采用空闲列表

虚拟机为对象分配空间是非常频繁的,如果同时为多个线程分配对象,就涉及到并发安全控制了。一般有两个解决方案:

  • 第一种是对分配内存空间动作进行同步:使用CAS配上失败重试的方式保证更新操作的原子性。
  • 第二种是把内存分配的动作分配在不同的空间中进行:即每个线程在Java堆中预先分配一小块内存,称之为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配。只有TLAB使用完并需要分配新的TLAB的时候才需要同步锁定。

三、初始化内存空间。

    内存分配完成之后,虚拟机会将分配空间内都初始化为零值(不包括对象头),如果使用TLAB分配,这一过程也可以提前至TLAB分配时进行。

四、设置对象的对象头。

    接下来虚拟机要设置对象的对象头。包括对象的哈希码、类元素信息、GC分代年龄等,这些信息都放置在对象头中。

五、执行<init>方法,初始化对象内成员。

这样,一个真正可用的对象才算完全产生出来。

2、对象的内存布局

内存中,对象存储布局可分为三部分:对象头(Header),示例数据(Instance Data)和对齐填充(Padding)。

  • 对象头:包括两部分信息。
  • 第一部分用于存储对象自身的运行时数据,如哈希码,GC分代年龄、锁状态、线程持有锁、等等。这部分数据的长度在32为或64位,官方称之为“Mark Word”。Mark-word被设计成一个非固定的数据结构以便在极小的空间内存储尽量多的信息,它会根据对象的状态复用自己的存储空间。

  • 对象头的另一部分是类型指针,即对象指向它的类元素的指针,通过这个指针来确定这个对象是哪个类的实例。(如果Java对象是一个数组,则对象头还必须有一块用于记录数组长度的数据。因为Java数组元数据中没有数组大小的记录)
  • 实例数据:这部分是真正用来存储对象有效信息的地方,也是在程序代码中所定义的各种类型的字段内容。分配策略:相同宽度的字段总是被分配到一起。
  • 对齐填充:这部分并不是必需存在的,只是起着占位符的作用。因为HotSpot虚拟机要求对象起始地址必须是8字节的倍数。也就是说,对象的大小必须是8字节的整数倍。

3、对象的访问方式

我们可以通过使用栈上的reference数据来操作堆上的具体对象。有两种方式来访问具体对象:句柄和直接指针。

  • 句柄:Java堆中划分出一个句柄池,专门用来存放对象的实例地址和类型地址。而栈中的reference只是该句柄池中某一句柄的地址。好处是当进行垃圾回收并被移动后,对象地址改变而reference的数据不用改变。

  • 直接指针:reference直接指向某一对象的地址。好处便是速度快,节省了一次定位的时间开销。

对比:

      使用直接指针访问方式的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象的访问在Java中非常频繁,因此这类开销积少成多后也是一项非常可观的执行成本。就本书讨论的主要虚拟机Sun HotSpot而言,它是使用第二种方式进行对象访问的,但从整个软件开发的范围来看,各种语言和框架使用句柄来访问的情况也十分常见。

 

参考《深入理解Java虚拟机》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值