- 在此之前我们先来看一下JDK和JRE。
我们可以把Java程序设计语言、Java虚拟机、Java类库这三部分统称为JDK(Java Development Kit),JDK是用于支持Java程序开发的最小环境。
可以把Java类库API中的Java SE API子集和Java虚拟机这两部分统称为 JRE(Java Runtime Environment),JRE是支持Java程序运行的标准环境。
Java内存区域
一、运行时数据区域
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域 有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而一直存在,有些区域则是 依赖用户线程的启动和结束而建立和销毁。(源于 :深入理解Java虚拟机(第3版))
这里我从线程是否共享来分别介绍这几个区域:
线程共享的有:堆、方法区
线程独享的包括:虚拟机栈、本地方法栈、程序计数器
-
线程共享
- 堆
Java堆(Java Heap)是虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,Java 世界里“几乎”所有的对象实例都在这里分配内存。
如果从分配内存的角度看,所有线程共享的Java堆中可以划分出多个线程私有的分配缓冲区 (Thread Local Allocation Buffer,TLAB),以提升对象分配时的效率。
将Java 堆细分的目的只是为了更好地回收内存,或者更快地分配内存。也就是说堆其实是用来存放对象实例的,除此之外数组的的数据也是放在堆里面的。
- 方法区
方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。
在JDK 6的 时候HotSpot开发团队就有放弃永久代,逐步改为采用本地内存(Native Memory)来实现方法区的计 划了,到了JDK 7的HotSpot,已经把原本放在永久代的字符串常量池、静态变量等移出,而到了 JDK 8,终于完全废弃了永久代的概念,改用与JRockit、J9一样在本地内存中实现的元空间(Meta-space)来代替,把JDK 7中永久代还剩余的内容(主要是类型信息)全部移到元空间中。
类被解析之后的信息是存在方法区的。
-
线程独享
- 虚拟机栈
Java虚拟机栈(Java Virtual Machine Stack)也是线程私有的,它的生命周期与线程相同。
虚拟机栈描述的是Java方法执行的线程内存模型:每个方法被执行的时候,Java虚拟机都 会同步创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态连接、方法出口等信息。每一个方法被调用直至执行完毕的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。也就是说:栈是进行程序指令顺序控制的。
- 本地方法栈
本地方法栈(Native Method Stacks)与虚拟机栈所发挥的作用是非常相似的,其区别只是虚拟机 栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的本地(Native) 方法服务。
- 程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在Java虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过线程轮流切换、分配处理器执行时间的方式来实现的,在任何一 个确定的时刻,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因 此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程 之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
通俗来讲就是:什么时候进栈、什么时候出栈,何时开始何时结束,都是由计数器控制的。
-
下面我们用一段程序来举例,在一个方法执行的过程中到底是怎样进行的:
class BirthDate { private int day; private int month; private int year; public BirthDate(int d, int m, int y) { day = d; month = m; year = y; } } public class Test{ public static void main(String args[]){ int date = 9; Test test = new Test(); test.change(date); BirthDate d1= new BirthDate(7,7,1970); } public void change1(int i){ i = 1234; } }
- Test类以及BirthDate 类都经过编译,他们各自的类信息存储在方法区里面
- main方法开始执行,main方法入栈,同时为main() 创建一个栈帧
- int data = 9;data是基础类型,并且是在栈中声明的,所以他的句柄信息(引用)以及他的值都在栈中。
- Test test = new Test(); test存在栈中,(new Test())放在堆里,并且由对象中指向类信息的指针指向方法区中对应的类
- test.change(date); change()方法入栈并开辟栈帧,i 为形参并且为基本数据类型,在栈中声明,同 data ; change方法在执行完毕之后就会出栈。
- BirthDate d1= new BirthDate(7,7,1970); d1(句柄信息)为对象引用,存放在栈中,(new BirthDate()) 存放在堆中。BirthDate()函数执行,开辟栈帧,三个形参都是基本数据类型,在栈中声明,同 data 和 i , 构造函数在执行完毕之后,栈帧销毁(出栈,对应的局部变量表也会被销毁,他主要保存函数的参数以及局部的变量信息,也就是说 d、m、y也会被销毁)
- .main方法执行完之后出栈,date变量,test,d1引用将从栈中消失,new Test(),new BirthDate()将等待垃圾回收。
-
运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池表(Constant Pool Table),用于存放编译期生成的各种字面量(包括字符串文本以及被声明为final类型的常量值)与符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
二、对象创建
-
在代码的层面,对象创建通常就是通过 new 关键字,但是在Java虚拟机里面创建一个对象,可决不是这么简单的。
-
当Java虚拟机遇到一条字节码new指令时,首先去检查这个指令的参数是否能在常量池中定位到 一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
-
类加载并初始化
- java是使用⭐双亲委派模型来进行类的加载的
- 双亲委托模型的工作过程是:如果一个类加载器(ClassLoader)收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委托给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父类加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需要加载的类)时,子加载器才会尝试自己去加载。
- 加载
- 由类加载器负责根据一个类的全限定名来读取此类的二进制字节流到JVM内部,并存储在运行时内存区的方法区,然后将其转换为一个与目标类型对应的java.lang.Class对象实例
- 验证
- 各种验证:文件格式验证、元数据验证、字节码验证等等
- 准备
- 为类中的所有静态变量分配内存空间,并为其设置一个初始值(由于还没有产生对象,实例变量不在此操作范围内)
被final修饰的static变量(常量),会直接赋值;
- 为类中的所有静态变量分配内存空间,并为其设置一个初始值(由于还没有产生对象,实例变量不在此操作范围内)
- 解析
- 将常量池中的符号引用转为直接引用
- 初始化(先父后子)
- 为静态变量赋值
- 因为子类存在对父类的依赖,所以类的加载顺序是先加载父类后加载子类,初始化也一样。不过,父类初始化时,子类静态变量的值也是有的,是默认值。
- java是使用⭐双亲委派模型来进行类的加载的
-
在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成 后便可完全确定,为对象分配空间的任务实际上便等同于把一块确定 大小的内存块从Java堆中划分出来。
- 在这里有两种方式:
- 指针碰撞:假设Java堆中内存是绝对规整的,所有被使用过的内存都被放在一 边,空闲的内存被放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间方向挪动一段与对象大小相等的距离,这种分配方式称为"指针碰撞"
- 这有一个问题是需要考虑的:对象创建在虚拟机中是非常频繁的行 为,即使仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象 A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。
- 解决上述的情况有两种方式
- 一种是对分配内存空间的动作进行同步处理——实际上虚拟机是采用CAS配上失败 重试的方式保证更新操作的原子性;
- 另外一种是把内存分配的动作按照线程划分在不同的空间之中进 行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完 了,分配新的缓存区时才需要同步锁定。
- 空闲列表:但如果Java堆中的内存并不是规整的,已被使用的内存和空闲的内存相互交错在一起,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”(Free List)。
三、对象的内存布局
在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和 对齐填充(Padding)。
- 对象头:HotSpot虚拟机对象的对象头部分包括两类信息。
- 第一类是用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。官方称它为 Mark Word(一个有着动态定义的数据结构)。
- 对象头的另外一部分是类型指针,即对象指向它的类型元数据的指针。在上述代码中的例子: new BirthDate(),对象实例存放在堆里,对象头中的这部分类型指针,指向的就是方法区对应的类信息。
- 实例数据部分是对象真正存储的有效信息。
- 对象的第三部分是对齐填充,这并不是必然存在的,也没有特别的含义。