虚拟机
jvm
- 加载过程:
- A.java经过编译器编译,生成A.class字节码文件,多个class文件会被打包成jar文件
- 程序访问A这个类时,会通过ClassLoader类加载器将A.class加载到jvm的内存中
dalvik+JIT
-
加载过程:
- A.java经过编译器编译,生成A.class字节码文件
- dx工具将class文件打包成dex文件
-
JIT(Just In Time Compiler):
- 即时编译策略,即动态编译
- 缺点:
- 每次启动应用都要重新编译(没有缓存)
- 所以运行时比较耗电
art+AOT
- AOT(Ahead Of Time)
- 提前编译策略,即静态编译
- 缺点:
- 应用首次安装和系统升级之后(需要重新编译)比较耗时
- 编译后的文件占用更多的内存空间,缓存的结果
JIT和AOT的区别
无非就是空间换时间
OSR机制(on stack replacement)
一种在运行时替换正在运行的函数/方法的栈帧的技术。
JVM拿到手的是含有Java字节码的Class文件,并不能直接在硬件上执行,而需要JVM要么解释执行之,要么做JIT编译后执行。为了平衡启动性能与顶峰性能的需求,现代主流JVM都引入了多层编译机制,在刚开始的时候采用比较低优化的层级来执行,等某块代码热了之后再使用较高优化的层级来执行。
所以OSR的重点就是:执行引擎有多个不同优化程度的层级,一个函数正在执行的过程中可以在不同优化层级之间迁移”
即,当一个函数/方法大量执行的时候,就会成为热点函数/方法,会触发OSR机制,JVM就会把该方法JIT编译了,执行引擎便在仍在执行该方法的情况下,从原本的层级跳转到这个新JIT编译好的版本的代码去。
GC
JVM如何确定某个对象是垃圾
引用计数法
在Java中,引用和对象是有关联的。如果要操作对象则必须用引用进行。因此,很显然一个简单的办法是通过引用计数来判断一个对象是否可以回收。简单说,即一个对象如果没有任何与之关联的引用,则说明对象不太可能再被用到,那么这个对象就是可回收对象。这种方式即是引用计数法。
这种方式的问题是无法解决循环引用的问题。
public static void main(String[] args){
Object object1=new Object();
Object object2=new Object();
object1.object=object2;
object2.object=object1;
object1=null;
object2=null;
}
显然,在最后,object1和object2的内存块都不能再被访问到了,但他们的引用计数都不为0,这就会使他们永远不会被清除。
可达性分析
为了解决引用计数法的循环引用问题,Java使用了可达性分析的方法。通过一系列的“GC roots”对象作为起点搜索。如果在“GC roots”和一个对象之间没有可达路径,则称该对象是不可达的。
要注意的是,不可达对象不等价于可回收对象,不可达对象变为可回收对象至少要经过两次标记过程。两次标记后仍然是可回收对象,则将面临回收。
什么是GC root
GC管理的主要区域是Java堆,一般情况下只针对堆进行垃圾回收。方法区、栈和本地方法区不被GC所管理,因而选择这些区域内的对象作为GC roots,被GC roots引用的对象不被GC回收。
- 所有已加载的类
- 虚拟机栈中引用的对象
a是栈帧中的本地变量,a就是GC Root,由于a=null,a与new Rumenz()对象断开了链接,所以对象会被回收。public class Rumenz{ public static void main(String[] args) { Rumenz a = new Rumenz(); a = null; } }
- 方法区中类静态属性引用的对象;
- 方法区中常量引用的对象;
- 本地方法栈中JNI(即一般说的Native方法)引用的对象;
垃圾回收算法
标记-清除算法(Mark-Sweep)
最基础的垃圾回收算法,分为两个阶段,标记和清除。标记阶段标记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空间。
缺点:该算法最大的问题是内存碎片化严重,后续可能发生大对象不能找到可利用空间的问题。
复制算法(Copying)
为了解决Mark-Sweep算法内存碎片化的缺陷而被提出的算法。按内存容量将内存划分为等大小的两块。每次只使用其中一块,当这一块内存满后将尚存活的对象复制到另一块上去,把已使用的内存清掉。
缺点:这种算法虽然实现简单,内存效率高,不易产生碎片,但是最大的问题是可用内存被压缩到了原本的一半。且存活对象增多的话,Copying算法的效率会大大降低。
标记-整理算法(Mark-Compact)
结合了以上两个算法,为了避免缺陷而提出。标记阶段和Mark-Sweep算法相同,标记后不是清理对象,而是将存活对象移向内存的一端。然后清除端边界外的对象。
分代收集算法(Generational Collection)
分代收集法是目前大部分JVM所采用的方法,其核心思想是根据对象存活的不同生命周期将内存划分为不同的域,一般情况下将GC堆划分为老生代(Tenured/Old Generation)和新生代(Young Generation)。老生代的特点是每次垃圾回收时只有少量对象需要被回收,新生代的特点是每次垃圾回收时都有大量垃圾需要被回收,因此可以根据不同区域选择不同的算法。
目前大部分JVM的GC对于新生代都采取Copying算法,因为新生代中每次垃圾回收都要回收大部分对象,即要复制的操作比较少,但通常并不是按照1:1来划分新生代。一般将新生代划分为一块较大的Eden(伊甸园)空间和两个较小的Survivor(幸存者)空间(From Space, To Space),每次使用Eden空间和其中的一块Survivor空间,当进行回收时,将该两块空间中还存活的对象复制到另一块Survivor空间中。
而老生代因为每次只回收少量对象,因而采用Mark-Compact算法。
另外,处于方法区中的叫永生代。它用来存储class类,常量,方法描述等。对永生代的回收主要包括废弃常量和无用的类。
对象的内存分配主要在新生代的Eden Space和Survivor Space的From Space(Survivor目前存放对象的那一块),少数情况会直接分配到老生代。当新生代的Eden Space和From Space空间不足时就会发生一次GC,进行GC后,Eden Space和From Space区的存活对象会被挪到To Space,然后将Eden Space和From Space进行清理。如果To Space无法足够存储某个对象,则将这个对象存储到老生代。在进行GC后,使用的便是Eden Space和To Space了,如此反复循环。当对象在Survivor区躲过一次GC后,其年龄就会+1。默认情况下年龄到达15的对象会被移到老生代中。