程序计数器
是一块较小的内存空间,字节码解析器工作时通过改变程序计数器的值来选取下一条需要执行的字节码指令。程序的分支、循环、跳转、异常处理以及线程恢复等基础功能都是依赖程序计数器来完成。
Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间片来实现,因此,为了确保线程切换之后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器,因此程序计数器是线程私有的内存。
程序计数器是java虚拟机中唯一一个没有规定任何内存溢出OutOfMemoryError的内存区域。
java虚拟机栈
Java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是java方法执行的内存模型:每个方法被执行时都会同时创建一个栈帧用于存放局部变量表、操作数栈、动态连接和方法出口等信息。每个方法被调用直至执行完成过程,就对应着一个栈帧在虚拟机中从入栈到出栈的过程。
Java虚拟机栈有两种异常状况:如果线程请求的栈深度大于虚拟机所允许的最大深度时,抛出StackOverflowError异常;如果虚拟机栈可以动态扩展,当扩展时无法申请到足够内存时会抛出OutOfMemoryError异常。
本地方法栈
本地方法栈与java虚拟机栈作用非常类似,其区别是:java虚拟机栈是为虚拟机执行java方法服务,而本地方法栈是为虚拟机调用的操作系统本地方法服务。HotSpot不区分本地方法栈和虚拟机栈。
堆
堆是java虚拟机所管理的内存区域中最大一块,java堆是被所有线程所共享的一块内存区域,在java虚拟机启动时创建,堆内存的唯一目的就是存放对象实例。几乎所有的对象实例都是在堆分配内存。
Java堆是垃圾收集器管理的主要区域,从垃圾回收的角度看,由于现在的垃圾收集器基本都采用的是分代收集算法,因此java堆还可以初步细分为新生代和年老代。
Java虚拟机规范规定,堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。在实现上即可以是固定大小的,也可以是可动态扩展的。如果在堆中没有内存完成实例分配,并且堆大小也无法在扩展时,将会抛出OutOfMemoryError异常。
方法区
方法区与堆一样,是被各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。虽然java虚拟机规范把方法区描述为堆的一个逻辑部分,但是方法区却有一个别名叫Non-Heap(非堆)。
Sun HotSpot虚拟机把方法区叫永久代(Permanent Generation),其他虚拟机没有永久代的概念。方法区中最重要的部分是运行时常量池。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面变量、符号引用、直接引用等,这些内容将在类加载后存放到方法区的运行时常量池中,另外在运行期间也可以将新的常量存放到常量池中,如String的intern()方法。
方法区和运行时常量池在无法满足内存分配时,也会抛出OutOfMemoryError异常。
直接内存
直接内存并不是java虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域,但是在java开发中还是会使用到。
JDK1.4中新引入的NIO(new I/O),引入了一种基于通道(Channel)和缓冲区(Buffer)的I/O方式,可以使用操作系统本地方法库直接分配堆外内存,然后通过一个存储在java堆里面的DirectByteBuffer对象作为堆外直接内存的引用进行操作,避免了java堆内存和本地直接内存间的数据拷贝,可以显著提高性能。
虽然直接内存并不直接收到java虚拟机内存影响,但是如果java虚拟机各个内存区域总和大于物理内存限制,从而导致直接内存不足,动态扩展时也会抛出OutOfMemoryError异常。
对象的创建
虚拟机遇到一条new指令时,首先检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载,解析和初始化。如果没有则执行类加载过程。
类加载检查通过后,虚拟机为对象分配内存。对象所需内存的大小在类加载完成后完全确定。假设java堆是绝对规整的,空闲内存与用过的内存中间有个指针,分配的时候就是把指针向空闲空间那边移动一段与对象大小相等的距离。这种分配方式称为“指针碰撞”。如果不是规整的,虚拟机就维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一个足够大的空间划分给对象。并更新列表上的记录。这种分配方式便是”空闲列表“。
还有一个并发问题,有两种解决方案:
1. 对分配内存空间的动作进行同步处理。实际上虚拟机采用CAS配上失败重试的方法保证更新操作的原子性。
2. 把内存分配的动作按照线程划分在不同的空间之中进行。即每个线程在java堆中预先分配一小块内存,称为本地线程分配缓冲TLAB。哪个线程要分配内存,就在哪个线程的TLAB上分配。只有TLAB用完并分配新的TLAB时,才需要同步锁定。虚拟机是否采用TALB,通过参数-XX:+/-UseTLAB设定。
内存分配完成后虚拟机将分配到的空间都初始化为0值(不包括对象头)。保证对象的实例字段在java代码中可以不赋初始值就可以直接使用。
接下来,虚拟机对对象进行必要的设置,例如这个对象是哪个类的实例,如何才能找到类的元数据信息,对象的哈希码等信息,这些信息存放在对象的对象头之中。
执行完new指令之后,接下来会执行方法。进行初始化。
对象的内存布局
对象在内存中储存的布局可以分为3块区域:对象头,实例数据和对齐填充。
HotSpot虚拟机的对象头包括两部分信息,第一部分用于存储对象自身运行时数据,如哈希码,GC分代年龄,锁状态标志等。对象头的另外一部分是类型指针。即指向它的类元数据的指针。虚拟机通过这个指针确定对象是哪个类的实例。注意,并不是所有的虚拟机实现都必须在对象数据上保留类型指针。如果是java数组,在对象头还需要有一块用于记录数组长度的数据。因为虚拟机无法从数组的元数据中确定数组的大小。而普通对象可以。
实例数据才是对象真正储存的有效信息。也是在程序代码中所定义的各种类型的字段内容。HotSpot虚拟机把相同宽度的字段分配在一起。满足这一前提下,父类中定义的变量出现在子类前面。
对齐填充并不是必然存在的。HotSpot虚拟机的自动内存管理要求对象起始地址必须是8字节的整数倍。也就是说对象的大小必须是8字节的整数倍,而对象头正好是8字节的整数倍。因此当实例数据没有对齐时需要填充。
对象的访问定位
java程序需要通过栈上的reference数据来操作堆上的具体对象。reference类型只规定了一个指向对象的引用。目前主流的有使用句柄和直接指针两种。
- 使用句柄,java堆中划分出一块内存来作为句柄池,reference储存的就是对象的句柄地址,而句柄包含了对象实例数据与类型数据的各自的具体地址信息。
- 直接内存访问,reference存储的是对象地址,而对象里面应该有一个到对象类型数据的指针。
简单虚拟机参数
- -Xmx,-Xms:堆的最大值与最小值
- -Xss:栈容量
- MaxPermSize:最大方法区容量。
String.intern()
intern方法的作用:如果字符串常量池中已经包含一个等于String对象的字符串,则返回代表池中这个字符创的对象。否则,将此String对象包含的字符串添加到常量池中,并且返回此String对象的引用。
JKD1.6中,intern()方法会在首次遇到的字符串复制到永久代中,返回的也是永久代中这个字符串的引用。而由StrignBuilder创建的字符串实例在java堆上,所以不是同一个引用。JKD1.7不会再复制实例。只是在常量池中记录首次出现的实例引用。