-
Java对象在虚拟机中的生命周期
-
Java的GC机制
注意的是,Android中的Dalvik和ART并不属于JVM。
==========================================================================
当我们执行一个Java程序时,它的执行流程如图所示:
图中可以看出,JVM执行流程分为两个部分,分别是编译时环境和运行时环境,当一个Java文件经过Java编译器编译后会生成一个 .class
文件,这个 .class
会交由JVM来处理。
Jvm和Java语言没有什么必然的联系,它只跟特定的二进制文件 Class文件有关。所以任何语言只要能编译出 .class
文件,就能被JVM识别且执行。
==========================================================================
这里讲的结构,并不是JVM物理上的结构,而且是其实现逻辑,是抽象层面上的结构。
我说我是个车轮,是因为我走路的时候把自己当成车轱辘来滚,而不是我真的是个轮子。
按照Java虚拟机规范,抽象的JVM如图所示:
可以看出Java虚拟机包括 运行时数据区域、执行引擎、本地库接口和 本地方法库。类加载子系统并不时JVM的内部结构。
在这些区域里,像 方法区、Java堆、本地库接口,垃圾回收器、即时编译器都是线程共享的。
Java文件被编译后生成了 Class文件,这种二进制格式的文件不依赖与特定的硬件和操作系统。
每一个class文件都对应着唯一的类或接口的定义信息,但是类或者接口并不一定定义在文件中,比如类可以通过类加载器直接生成。之前说过,任何语言只要能编译成Class文件,就可以被Java虚拟机识别并且执行,Class文件的重要性可见一斑。
下面我们来学习Class文件格式:
ClassFile {
u4 magic; // 魔数,表明当前文件是.class文件,固定0xCAFEBABE
u2 minor_version; // Class文件的副版本号
u2 major_version; //Class文件主版本号
u2 constant_pool_count; // 常量池计数
cp_info constant_pool[constant_pool_count-1]; // 常量池内容
u2 access_flags; // 类/接口访问标识
u2 this_class; // 当前类索引
u2 super_class; // 父类索引
u2 interfaces_count; // 接口计数器
u2 interfaces[interfaces_count]; // 接口表
u2 fields_count; // 字段计数器
field_info fields[fields_count]; // 字段表
u2 methods_count; // 方法计数器
method_info methods[methods_count]; // 方法表
u2 attributes_count; // 属性计数器
attribute_info attributes[attributes_count]; // 属性表
}
其中:uX 代表 X字节的无符号类型。比如u4就是4字节的无符号类型
一个Java文件被加载到JVM内存中到从内存中被卸载的过程被称为类的生命周期。
类的生命周期包括的阶段分别是:加载、链接、初始化、使用和卸载。其中链接包括验证、准备和解析。因此类的生命周期被分为了7个阶段,顺序如下所示。
- 加载
查找并加载Class文件
- 链接
包括验证、准备和解析
(1) 验证:确保被导入类型的正确性
(2)准备:为类的静态字段分配字段,并使用
(3)解析:虚拟机将常量池内的符号引用替换为直接引用
- 初始化
将类变量初始化为正确初始值
-
使用
卸载
其中前三个阶段称为类的加载阶段。
在《深入理解JVM》中,上述第一点,加载阶段(非类加载阶段)主要做了3件事情:
-
根据特定名称查找类或接口类型的二进制字节流
-
将这个二进制字节流所代表的静态存储结构 转化成 方法区的运行时数据结构
-
在内存中生成了一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入口。
其中第一件事情就是由Java虚拟机外部的类加载子系统来完成的。
类加载子系统通过多种类加载器来查找和加载Class文件到JVM中,JVM有两种类加载器,分别是系统加载器和自定义加载器。之前对类加载机制做过理解:Java ClassLoader总结
这里就复制其中比较关键的东西吧:
- Bootstrp ClassLoader(引导类加载器)
Bootstrp加载器是由C++语言编写的,它是在JVM启动后初始化的,主要负责加载%JAVA_HOME%/jre/lib
, -Xbootclasspath
参数指定的路径以及%JAVA_HOME%/jre/classes中的类。
因为其是由C++写的,所以不能被Java代码访问到,但是可以查询某个类是否被引导类加载器加载过。
- Extensions ClassLoader(拓展类加载器)
Bootstrp Loader加载ExtClassLoader,并且设置其父加载器(是父加载器而不是父类哦)为自己,这个ExtClass Loader是java编写的,它主要加载%JAVA_HOME%/jre/lib/ext
这个路径下所有的classes目录以及java.ext.dirs
系统变量指定路径中的类库。
- Application ClassLoader(应用程序类加载器)
Bootstrp Loader加载完ExtClassLoader之后会加载AppClassLoader,并指定其父加载器为ExtClassLoader,它的作用是加载当前应用程序Classpath
目录,以及系统属性java.class.path
所指定位置的类或者jre文档,它也是Java的默认加载器。
关于ClassLoader的学问我们后边再写一篇,加深理解
==========================================================================
Java的内存不仅仅是堆内存和栈内存。
1.程序计数器
为了保证程能够连续的执行下去,处理器必须具有某些手段来确定下一条指令的地址。而程序计数器正是起到这种作用。
程序计数器也叫PC寄存器,是一块较小的内存空间。在虚拟机概念模型中,字节码解释器的工作时就时通过改变程序计数器来选取下一个条需要执行的字节码指令的。
JVM的多线程是通过轮流切换并分配处理器执行时间的方式来实现的。在一个确定的时刻只有一个处理器执行一条线程中的指令。为了在线程切换后能恢复到正确的执行位置,每个线程都会有一个独立的程序计数器,因此程序计数器是私有的。
如果线程执行的方法不是native方法,则程序计数器保存在正在执行的字节码指令地址,否则程序计数器的值为空。程序计数器是JVM规范中唯一没有任何OOM情况的数据区域
2.Java虚拟机栈
每一条Java虚拟机线程都有一个线程私有的Java虚拟机栈。它的生命周期与线程相同。
Java虚拟机栈存储线程中Java方法调用的状态,比如局部变量、参数、返回值以及运算的中间结果等。
一个Java虚拟机栈包含了多个栈帧,一个栈帧用来存储局部变量、操作数栈、动态链接、方法出口等信息。当线程调用一个Java方法时,虚拟机就压入一个新的栈帧到该线程的Java虚拟机栈中,在该方法执行完成后,这个栈帧就从Java虚拟机栈中弹出。
Java虚拟机规范中定义了两种异常情况:
-
如果线程请求分配的栈容量超过Java虚拟机所允许的最大容量,Java虚拟机就会抛出 StackOverflowError,即爆栈
-
如果JVM栈可以动态扩展,但是扩展时无法申请到足够的内存,或者在创建新的线程时,没有足够的内存去创建对应的JVM,就会抛出 OutOfMemoryError异常,即OOM
因为大部分JVM都是可以扩展的,所以相比于爆栈,我们见到OOM的情况更多。
3.本地方法栈
JVM可能要用到C Stacks来支持Native语言,这个C Stacks就是本地方法栈。
它与JVM栈类似,只不过本地方法栈是用来支持Native方法的,如果Java虚拟机不支持Native方法,并且也不依赖于C Stacks,可以无需支持本地方发展。Jvm可以自由的实现本地方法栈,比如 HotSpot VM将本地方发展和Java虚拟机栈合二为一。
本地方法栈也会抛出 StackOverflowError和OutOfMemoryError的异常。
4.Java堆
Java堆是被所有线程共享的运行时内存区域。Java堆用来存放对象实例。
几乎所有的对象实例都在这里分配内存。Java堆存储的对象被垃圾收集器管理,这些受管理的对象无法显式的销毁。
从内存回收的角度来分,Java堆可以粗略的分为新生代和老年代。
从内存分配的角度来分,Java堆中可能划分出多个线程私有的分配缓冲区。
Java虚拟机规范中定义了一种异常情况:如果在堆中没有足够的内存来完成实例分配,并且堆也无法进行扩展式时,也会抛出OutOfMemoryError异常。
5.方法区
方法区是被线程共享时的内存区域,用来存储已经被Java虚拟机加载的类的结构信息。包括运行时常量池、字段和方法信息、静态变量等数据。方法区是Java堆的逻辑组成部分,它一样在物理上不用连续,并且可以选择在方法区中不实现垃圾收集。
方法区并不等同于永久代,只是因为HotSpot VM使用永久代来实现方法区,对于其他的JVM,比如J9和JRockit等,并不存在永久代等概念。
如果方法区不满足内存分配需求时,JVM也会抛出OOM异常。
6.运行时常量池
并不是运行时数据区域的一份子,而是方法区的一部分。
在前面的Class文件结构中我们看到了,Class文件不仅包含类的版本号、接口、字段等,还包含常量池。
它用来存放编译时期生成的字面量和符号引用,这些内容会在类加载后存放在方法区的运行时常量池中。
运行时常量池可以理解为是类或接口的常量池的运行时表现形式。
========================================================================
对象的创建是我们经常要做的事情,通常是通过new指令来完成一个对象的创建,当虚拟机接收到一个new指令时,它会做如下的操作:
-
判断对象对应的类是否加载、链接和初始化
-
为对象分配内存
类加载完成后,接着会在Java堆中划分一块内存分配给对象。内存分配是根据Java堆是否规整。有两种方式:
(1)指针碰撞,如果Java堆的内存是规整的,即所有用过的内存放在一边,而空闲的内存放在一边。分配内存时将位于中间的指针指示器向空闲的内存一动一段与对象大小想等的距离,这样便完成分配内存的工作
(2)空闲列表,如果Java堆的内存是不规整的,则需要由虚拟机维护一个列表来记录哪些内存是可以用的。
这样在分配的时候可以从列表中查询足够大的内存分配给对象。
Java堆的内存是否规整根据所采用的垃圾收集器是否带有压缩整理功能有关。
- 处理并发安全问题
创建对象是一个非常频繁的操作,所以需要解决并发的问题,有两种方式:
(1)对分配内存空间的动作进行同步处理,比如在虚拟机采用CAS算法并配上失败重试的方式保证更新操作的原子性
(2)每个线程在Java堆中预先分配一小块内存,这块内存成为本地线程分配缓冲,线程需要分配内存时,就在对应线程的TLAB上分配内存,当线程的TLAB用完并且被分配到了新的TLAB时,这时候才需要同步锁定。通过 -XX:+/-UserTLAB参数来设定虚拟机是否使用TLAB。
- 初始化分配到的内存空间
将分配到的内存,除了对象头外都初始化为零值
- 设置对象的对象头
将对象的所属类、对象的HashCode和对象的GC分代年龄等数据存储在对象的对象头中。
对象头的知识后面会梳理
- 执行init方法进行初始化
执行init()
,初始化对象的成员变量、调用类的构造方法,这样一个对象就被创建出来的。
PS:单从上面就可以知道,创建一个对象其实也会造成一定的COST,所以看了这些东西,你还会轻易的去new对象吗?你还会再onDraw() 里面去new对象吗?所以也请把对象的创建看成是一个轻微级的操作来看!
我们已经知道对象被创建了,堆又给对象分配了空间,那么对象在堆内存是如何进行布局的呢,它长的是什么样的呢?就是上一节所讲的,对象头是啥?
以HotSpot VM为例,对象在堆内存的布局分为三个区域:
- 对象头
对象头包括两部分信息,分别是 Mark Word和元数据指针
(1)Mark Word:用于存储对象运行时数据,比如 Hash Code、锁状态标志、CG分代年龄,线程持有的锁
(2)元数据指针:用于指向方法区中的目标类的元数据,通过元数据可以确定对象的具体类型。后面会细讲
- 实例数据
用于存储对象中的各种类型的字段信息(包括父类继承来的)
- 对齐填充
对齐填充不一定存在,起到了占位符的作用,没有特别的含义。
Mark Word在HotSpot中的实现类为markOop.hpp
,markOop被设计成一个非固定的数据结构,这是为了在极小的空间中存储尽量多的数据。
题外话
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在IT学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多程序员朋友无法获得正确的资料得到学习提升,故此将并将重要的Android进阶资料包括自定义view、性能优化、MVC与MVP与MVVM三大框架的区别、NDK技术、阿里面试题精编汇总、常见源码分析等学习资料。
【Android思维脑图(技能树)】
知识不体系?这里还有整理出来的Android进阶学习的思维脑图,给大家参考一个方向。
希望我能够用我的力量帮助更多迷茫、困惑的朋友们,帮助大家在IT道路上学习和发展~
互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在IT学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多程序员朋友无法获得正确的资料得到学习提升,故此将并将重要的Android进阶资料包括自定义view、性能优化、MVC与MVP与MVVM三大框架的区别、NDK技术、阿里面试题精编汇总、常见源码分析等学习资料。
【Android思维脑图(技能树)】
知识不体系?这里还有整理出来的Android进阶学习的思维脑图,给大家参考一个方向。
[外链图片转存中…(img-15hsRS3f-1647757172432)]
希望我能够用我的力量帮助更多迷茫、困惑的朋友们,帮助大家在IT道路上学习和发展~