JVM将class文件字节码文件加载到内存中, 并将这些静态数据转换成方法区中的运行时数据结构,在堆中生成一个代表这个类的java.lang.Class 对象,作为方法区类数据的访问入口。
.class文件
magic:确定一个文件是否能被JVM接收
version:版本号。向下兼容:高版本能执行低版本生成的.class文件
constants_pool:常量池相关。包括了代码中的字面量(文本字符,final常量值)和符号引用(函数/属性名)
access_flag:标识public final interface class abstarct等标识符
this_class:类的全限定名。this指针的实现
super_class:父类全限定名。super指针实现
field:描述类的属性
method:描述类的方法
类加载器
通过类全限定名获取二进制字节流;将字节流所代表的静态结构转换为方法区中的运行时结构
- 启动类加载器:Bootstrap ClassLoader,负责加载存放在JDK\jre\lib(JDK代表JDK的安装目录,下同)下,或被-Xbootclasspath参数指定的路径中的,并且能被虚拟机识别的类库
- 扩展类加载器:Extension ClassLoader,该加载器由sun.misc.Launcher$ExtClassLoader实现,它负责加载DK\jre\lib\ext目录中,或者由java.ext.dirs系统变量指定的路径中的所有类库(如javax.*开头的类),开发者可以直接使用扩展类加载器。
- 应用程序类加载器:Application ClassLoader,该类加载器由sun.misc.Launcher$AppClassLoader来实现,它负责加载用户类路径(ClassPath)所指定的类,俗称自定义,开发者可以直接使用该类加载器
执行过程:双亲加载机制
类加载器加载类时,首先传给 父类加载器 ,直至传到顶层。只有父加载器反馈 不能加载 ,子类才尝试自己加载该类。
为何要引入双亲加载机制?
这样使得Java类随着类加载器而具有优先级关系,无论加载什么类,都会优先查找JDK\jre\lib目录下的类,即使自定义Object类也不用担心会和jre中的Object混淆
提问:描述一下JVM加载class文件的原理机制?
JVM中类的装载是由类加载器及其子类来实现的,Java中的类加载器是一个重要的Java运行时系统组件,它负责在运行时查找和装入类文件中的类。
由于Java的跨平台性,经过编译的Java源程序并不是一个可执行程序,而是一个或多个类文件。当Java程序需要使用某个类时,JVM会确保这个类已经被加载、连接(验证、准备和解析)和初始化。类的加载是指把类的.class文件中的数据读入到内存中,通常是创建一个字节数组读入.class文件,然后产生与所加载类对应的Class对象。加载完成后,Class对象还不完整,所以此时的类还不可用。当类被加载后就进入连接阶段,这一阶段包括验证、准备(为静态变量分配内存并设置默认的初始值)和解析(将符号引用替换为直接引用)三个步骤。最后JVM对类进行初始化,包括:
1)如果类存在直接的父类并且这个类还没有被初始化,那么就先初始化父类;
2)如果类中存在初始化语句,就依次执行这些初始化语句。
类的加载是由类加载器完成的,类加载器包括:根加载器(BootStrap)、扩展加载器(Extension)、系统加载器(System)和用户自定义类加载器(java.lang.ClassLoader的子类)。
从Java 2(JDK 1.2)开始,类加载过程采取了父亲委托机制(PDM)。PDM更好的保证了Java平台的安全性,在该机制中,JVM自带的Bootstrap是根加载器,其他的加载器都有且仅有一个父类加载器。类的加载首先请求父类加载器加载,父类加载器无能为力时才由其子类加载器自行加载。JVM不会向Java程序提供对Bootstrap的引用。
类的生命周期
-
加载
通过类的全限定名来获取定义此类的二进制字节流,将这个类字节流代表的静态存储结构转为方法区的运行时数据结构。这项工作由类加载器完成 -
验证
基于字节流,对文件格式、元数据、字节码、符号引用验证,确保class文件符合当前虚拟机的要求 -
准备
为类的静态变量分配内存,并将其初始化为默认值 -
解析
把类中的符号引用转换为直接引用。将编译期可知,运行期不可变 的方法(静态方法和私有方法),转化为直接引用在类加载期并不能确定所有方法的引用,如方法的重写,接口的实现等,Java所有方法都会在被调用前确定引用位置。而这则依靠动态解析:分派调用来完成
解析无明确规定时间,可以等到初始化后,有符号引用将要被使用(类的某个方法要被调用)时进行解析
-
初始化
执行类构造器方法的过程。且只有在以下几种情况时,必须要立刻初始化。- 使用new关键字实例化对象、访问或者设置一个类的静态字段/类方法
- 初始化类的时候,如果其父类没有被初始化过,则要先触发其父类初始化
- 使用java.lang.reflect包的方法进行反射调用的时候,如果类没有被初始化,则要先初始化
- 虚拟机启动时,用户会先初始化要执行的主类(含有main)
-
卸载
当满足以下几个条件时,JVM会将类信息卸载- 该类的所有实例化对象被GC
- 该类没有在其他地方被引用
- 如果采用自定义类加载器,则需其同样被GC
对象的内存布局
对象分配规则
- 对象优先分配在Eden区,如果Eden区没有足够的空间时,虚拟机执行一次Minor GC。
- 大对象直接进入老年代(大对象是指需要大量连续内存空间的对象)。这样做的目的是避免在Eden区和两个Survivor区之间发生大量的内存拷贝(新生代采用复制算法收集内存)。
- 长期存活的对象进入老年代。虚拟机为每个对象定义了一个年龄计数器,如果对象经过了1次Minor GC那么对象会进入Survivor区,之后每经过一次Minor GC那么对象的年龄加1,知道达到阀值对象进入老年区。
- 动态判断对象的年龄。如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代。
- 空间分配担保。每次进行Minor GC时,JVM会计算Survivor区移至老年区的对象的平均大小,如果这个值大于老年区的剩余值大小则进行一次Full GC,如果小于检查HandlePromotionFailure设置,如果true则只进行Monitor GC,如果false则进行Full GC。
对象的访问定位
句柄
句柄包含了对象的实例数据和其类型数据的地址信息
直接指针
直接指向实例数据,根据对象头中类型指针查找类型数据
对象创建过程
1.JVM遇到一条新建对象的指令时首先去检查这个指令的参数是否能在常量池中定义到一个类的符号引用。然后加载这个类
2.为对象分配内存。一种办法“指针碰撞”、一种办法“空闲列表”,最终常用的办法“本地线程缓冲分配(TLAB)”
TLAB:为每个线程预分配Eden区一部分,首先在该TLAB中为线程分配对象,当TLAB用尽之后再用CAS分配
3.将除对象头外的对象内存空间初始化为0
4.对对象头进行必要设置
参考链接: