Java内存区域与内存溢出异常

    Java虚拟机在执行Java程序的过程中会把他所管理的内存划分为若干个不同的数据区域。了解这些区域可以为接下来的学习打好基础。
一、运行时数据区域
1.程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
每条线程都有一个独立的程序计数器,各线程之间互不影响,存储独立。
如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果是Native方法,这个计数器值则为空(Undefined)。
2.Java虚拟机栈
Java虚拟机栈是线程私有的,他的生命周期与线程相同。虚拟机栈描述的是 Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。 每一个方法从调用直至执行完成的过程,就对应这一个栈帧在虚拟机栈中入栈到出栈的过程
局部变量表存放了编译器可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型)和returnAddress类型(指向了一条字节码指令的地址)。
long和double类型的数据会占用2个局部变量空间(slot),其余的数据类型只占用1个。
3.本地方法栈
本地方法栈(Native Method Stack)与虚拟机栈是类似的,他们之间的区别不过是虚拟机栈为虚拟机执行Java方法( 也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。
4.Java堆
Java堆(Java Heap)是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,但随着技术的发展不是所有的对象实例都存储于Java堆。
Java堆是垃圾处理器管理的主要区域,因此有时候也被称为"GC堆"(Garbage Collected Heap)。由于现在收集器基本都采用分代收集算法, 所以Java堆还可以细分为:新生代和老年代,再细致一点的有Eden空间、From Survivor空间、To Survivor空间等。从内存分配的角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB)。
5.方法区
方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被 虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。方法区描述为堆的一个逻辑部分,为了区分Java堆,所以它叫做Non-Heap(非堆)。
对于开发者来说更愿意把方法区称为:“永久代”(Permanent Generation), 方法区是JVM的规范,永久代是方法区的实现两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展到方法区,或者说 使用永久代来实现方法区而已。这样HotSpot的垃圾收集器可以向管理Java堆一样管理这部分内存(注意方法区也是需要回收内存的),省去专门为方法区编写内存管理代码的工作。使用永久代来实现方法区容易发生内存溢出问题。
JDK8的元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。
元空间相对于永久代的好处:
1)字符串等信息存在永久代中容易内存溢出。
2)永久代需要指定空间大小但是类及方法信息大小难以确定。
3)永久代会为GC带来不必要的复杂度,并且回收效率偏低。
6.运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。用于存放编译器生成的各种字面量(Literal)和符号引用(Symbolic References),这部分内容将在类加载后进入方法区的运行时常量池中存放。
1)字面量比较接近于Java语言层面的常量概念,如文本字符串、声明为final的常量值等。
2)符号引用则属于编译原理方面的概念,包括下面三类常量:
  • 类和接口的全限定名(Fully Qualified Name)
  • 字段的名称和描述符(Descriptor)
  • 方法的名称和描述符
7.直接内存
直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域。但是这部分内存也被频繁地使用,而且也可能导致OutOfMemoryError异常出现。
在JDK1.4中新加入了NIO类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库分配堆外内存,然后通过一个存储在java堆中的DirectByteBuffer对象作为这内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在java堆和Native堆来回复制数据。
栈、堆和方法区之间的关系梳理:
堆中存储类加载器生成的class对象,方法区存储类的字节码,栈则保存指令用来描述执行顺序。栈中的reference类型只想堆中的对象地址,堆中的对象地址指向方法区中对应的类信息的地址(采用的是直接指针访问)。
二、hotspot虚拟机对象探秘
1.对象的创建
虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
在类加载检查通过后,接下来虚拟机将为新生对象分配内存。
1)指针碰撞:假设java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。
2)空闲列表:如果java堆中的内存并不是规整的,已使用的内存和空闲的内存互相交错,那就没有办法简单进行指针碰撞了,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。
在使用Serial、ParNew等待Compact(压缩)过程的收集器时,系统采用的分配算法是指针碰撞,而使用CMS这种基于Mark-Sweep(标记-清除)算法的收集器时,通常采用空闲列表。
修改指针分配位置分配内存不是线程安全的,解决这种问题有两种方案:
1)对分配内存空间的动作进行同步处理——实际上虚拟机 采用CAS配上失败重试的方式保证更新操作的原子性;
2)把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer)TLAB。哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定。
内存分配完成后,虚拟机需要将分配到的 内存空间都初始化为零值(不包括对象头)。这一步操作保证了对象的实例字段在java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分带年龄等信息。
在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了,但从java程序的视角来看,对象创建才刚刚开始——<init>方法还没执行,所有的字段都还为零。所以,一般来说( 由字节码中是否跟随invokespecial指令所决定),执行new指令之后会接着执行<init>方法,把对象按照程序员的意愿进行初始化。
其实上面讲的一大堆过程包含了很多知识点,后面会慢慢细讲,现在只需要记住下面的过程即可。
简易过程图:
new——>在常量池查找并检查类是否加载——>分配内存——>初始化内存空间为零值——>对对象进行必要设置——>执行<init>方法
用专业名词:
new——>在常量池查找并检查类是否加载——>类加载过程(加载——>{验证——>准备——>解析}这三个过程通称为连接——>初始化)
2.对象的内存布局
在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
对象头包括两部分信息,第一部分用于存储对象自身的运行时数据:
这部分数据的长度在32位和64位的虚拟机(未开启压缩指针)中分别为32bit和64bit,官方称它为“Mark Word”。Mark Word被设计成一个非固定的数据结构以便在绩效的空间内存储尽量多的信息,它会根据对象的状态复用自己的存储空间。
对象的另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
接下来的实例数据部分是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。
3.对象的访问定位
Java程序通过栈上的reference数据来操作堆上的具体对象。reference类型只规定了一个指向对象的引用,所以访问堆上的对象实例数据和访问方法区上的对象类型数据由虚拟机自己定义。一般是两种方式:使用句柄和直接指针两种。
1)如果使用句柄访问的话,那么Java堆中将会划分出一块句柄池,reference中存储的就是对象 的句柄地址,而句柄中包含了对象实例数据(new出来的对象)和对象类型数据(class对象)各自的具体地址。
2)如果直接指针访问,那么java堆对象的布局中就必须考虑如何放置访问类型数据信息的地址,而reference中存储的就是对象地址。
使用句柄的方式访问的优势在于reference中的地址是稳定不变的,而用直接指针的方式,节省了一次指针定位的时间开销,所以速度快。HotSpot虚拟机采用的是直接指针。
三、OutOfMemory异常
1.java堆溢出
只要不断创建对象,并且保证GC Root到对象之间有可达路径来避免垃圾回收机制清除这些对象,即可模拟java堆溢出。除了会提示“java.lang.OutOfMemoryError”以外还会进一步提示“Java Heap space”。
-Xms20m(最小堆内存) -Xmx20m(最大堆内存,将最小值和最大值设置成一样可以避免堆自动扩展), -XX:+HeapDumpOnOutOfMemory可以让虚拟机在出现内存溢出异常时Dump出当前的内存堆转储快照。
2.虚拟机栈和本地方法栈溢出
1)如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出StackOverflowError
2)如果虚拟机在扩展栈时无法申请到足够的内存,则抛出OutOfMemory异常
栈容量只由-Xss参数设定
3.方法区和运行时常量池溢出
运行时产生大量的类去填充方法区使其溢出。但是元空间直接使用本地内存作为大小不容易溢出。永久代除了会提示“java.lang.OutOfMemoryError”以外还会进一步提示“PermGen space”。
永久代的大小:
-XX:PermSize -XX:MaxPermSize
可以通过一下参数来指定元空间大小:
-XX:MetaspaceSize,初始空间大小,达到该值就会触发垃圾收集进行类型卸载,同时GC会 对该值进行调整:如果释放了大量的空间,就适当降低该值;如果释放了很少的空间,那么在不超过 MaxMetaspaceSize时,适当提高该值。
   -XX:MaxMetaspaceSize,最大空间,默认是没有限制的。
4.本机直接内存溢出
前面提到的DirectByteBuffer分配内存时也会抛出内存溢出异常,但是它并不是真正向操作系统申请分配内存,而是通过计算得知内存无法分配,于是手动抛出异常。真正申请分配内存的方法是unsafe.allocateMemory()。
-XX MaxDirectMemorySize 设定本机直接内存容量,如果不指定,则默认与Java堆最大值(-Xms)一样。

上面介绍的这些个人认为很有必要去记忆和理解他们,这些都是jvm的基础,对以后的学习会非常有帮助。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值