JVM内存管理深度剖析
https://blog.csdn.net/qq_44076155/article/details/110676870
深入理解对象与垃圾回收机制
https://blog.csdn.net/qq_44076155/article/details/110676774
Android虚拟机与classLoader类加载机制
https://blog.csdn.net/qq_44076155/article/details/110676784
虚拟机中对象的创建过程
虚拟机遇到一条new指令时,首先检查是否被类加载器加载,如果没有,那必须先执行相应的类加载过程。
分配内存
内存划分
虚拟机将为新生对象分配内存。为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来
分配内存的两种方式
-
指针碰撞: Java堆中内存是绝对规整的,每次为新对象分配内存只需要把指针向空闲挪动一段与对象大小相等的距离
-
空闲列表: Java堆中的内存不规整,已使用的内存和空闲的内存相互交错,为了合理分配内存,虚拟机必须维护一个列表,记录内存块那些区域是可用的
指针碰撞
空闲列表
并发安全
在并发的情况下同时对一个内存块进行操作可能会导致线程不安全问题
解决方案
-
CAS机制:采用CAS配上失败重试的方式保证更新操作的原子性;
-
分配缓冲:每个线程在Java堆中预先分配一小块私有内存,也就是本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),这样就避免的线程竞争而导致的安全问题,大部分JVM采用这种方案
内存空间初始化
将分配到的初始化为零值(如int值为0,boolean值为false等等)
设置
设置对象头等相关信息
对象初始化
在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了,,执行new指令之后会接着把对象按照程序员的意愿进行初始化(构造方法),这样一个真正可用的对象才算完全产生出来。
对象内存布局
MarkWord,标记字(包括GC分代年龄,线程的锁,哈希码等)
对齐填充并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对对象的大小必须是8字节的整数倍。当对象其他数据部分没有对齐时,就需要通过对齐填充来补全。
对象的访问定位(两种方式)
-
句柄:Java堆中会划分一块内存作为句柄池,reference引用指向对象的句柄池,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。访问的对象地址稳定
-
直接指针:reference直接指向对象地址。不需要两次映射,速度更快
判断对象的存活(判断回收什么东西)
-
引用计数算法 :在对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1,当引用失效时,计数器减1.存在对象相互引用的情况,需要额外引入机制来处理
-
可达性分析(面试重点):这个算法的基本思路就是通过“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。
作为GC Roots的对象包括下面几种:
-
虚拟机栈(栈帧中的本地变量表)中引用的对象。
-
方法区中类静态属性引用的对象。
-
方法区中常量引用的对象。
-
本地方法栈中JNI(即一般说的Native方法)引用的对象。
-
JVM的内部引用(class对象、异常对象NullPointException、OutofMemoryError,系统类加载器)。
-
所有被同步锁(synchronized关键)持有的对象。
-
JVM内部的JMXBean、JVMTI中注册的回调、本地代码缓存等
-
JVM实现中的“临时性”对象,跨代引用的对象(在使用分代模型回收只回收部分代时)
各种引用
-
强引用:一般的Object obj = new Object() ,就属于强引用。在任何情况下,只有有强引用关联(与根可达)还在,垃圾回收器就永远不会回收掉被引用的对象
-
软引用:系统将要发生内存溢出(OuyOfMemory)之前,这些对象就会被回收(如果这次回收后还是没有足够的空间,才会抛出内存溢出)
-
弱引用:只能生存到下一次垃圾回收之前,GC发生时,不管内存够不够,都会被回收
-
虚引用:(随时会被回收掉)垃圾回收的时候收到一个通知,它的作用就是为了监控垃圾回收器是否正常工作
对象的分配策略
在Eden区的对象,没有被回收的会进入From和To区域,每进行一次垃圾回收,From区和To区中的存活对象会进行复制清除,markword上的GC分代年龄就会加一,达到JVM的指定年龄后,就会进入Tenured区(老年代)
栈上分配
没有逃逸指的是方法中的对象没有发生逃逸和线程中的对象没有发生逃逸。
如果是逃逸分析出来的对象可以在栈上分配的话,那么该对象的生命周期就跟随线程了,就不需要垃圾回收,如果是频繁的调用此方法则可以得到很大的性能提高。
采用了逃逸分析后,满足逃逸的对象在栈上分配
大对象直接进入老年代:典型的大对象是那种很长的字符串以及数组。这样做的目的:1.避免大量内存复制,2.避免提前进行垃圾回收,明明内存有空间进行分配。
空间分配担保:JVM进行担保,避免进入老年代时的额外一次GC
GC触发条件(什么时候回收)
新生代没有空间就会触发 Minor GC, 老年代没有足够的空间,那么就会进行一次FullGC,触发GC空间还是不够就会OOM
垃圾回收算法(怎样回收)
分代收集理论
描述
-
绝大部分的对象都是朝生夕死
-
熬过多次垃圾回收的对象就越难回收。
根据以上两个理论,朝生夕死的对象放一个区域,难回收的对象放另外一个区域,这个就构成了新生代和老年代。
垃圾回收算法
根据不同分代的应用场景不同,常用的有三种
新生代:复制算法 老年代:标记清除算法,标记整理算法
复制算法:
将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为了原来的一半。
Appel式回收
一种更加优化的复制回收分代策略:具体做法是分配一块较大的Eden区和两块较小的Survivor空间(你可以叫做From或者To,也可以叫做Survivor1和Survivor2)
专门研究表明,新生代中的对象98%是“朝生夕死”的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor[1]。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
标记-清除算法(Mark-Sweep)
算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
回收效率不稳定,如果大部分对象是朝生夕死,那么回收效率降低,因为需要大量标记对象和回收对象,对比复制回收效率很低。
它的主要不足空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
回收的时候如果需要回收的对象越多,需要做的标记和清除的工作越多,所以标记清除算法适用于老年代。复制回收算法适用于新生代。
标记-整理算法(Mark-Compact)
首先标记出所有需要回收的对象,在标记完成后,后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。标记整理算法虽然没有内存碎片,但是效率偏低。
我们看到标记整理与标记清除算法的区别主要在于对象的移动。对象移动不单单会加重系统负担,同时需要全程暂停用户线程才能进行,同时所有引用对象的地方都需要更新。
所以看到,老年代采用的标记整理算法与标记清除算法,各有优点,各有缺点。
Concurrent Mark Sweep (CMS)垃圾收集器
CMS收集器是一种以获取最短回收停顿时间为目标的收集器,基于“标记—清除”算法实现
整个过程分为4个步骤,包括:
-
初始标记-短暂,仅仅只是标记一下GC Roots能直接关联到的对象,速度很快。
-
并发标记-和用户的应用程序同时进行,进行GC Roots追踪的过程,标记从GCRoots开始关联的所有对象开始遍历整个可达分析路径的对象。这个时间比较长,所以采用并发处理(垃圾回收器线程和用户线程同时工作)
-
重新标记-短暂,为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。
-
并发清除
由于整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作,所以,从总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。
特点
CPU敏感:CMS对处理器资源敏感,毕竟采用了并发的收集、当处理核心数不足4个时,CMS对用户的影响较大。
浮动垃圾:由于CMS并发清理阶段用户线程还在运行着,伴随程序运行自然就还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉它们,只好留待下一次GC时再清理掉。这一部分垃圾就称为“浮动垃圾”。
由于浮动垃圾的存在,因此需要预留出一部分内存,意味着 CMS 收集不能像其它收集器那样等待老年代快满的时候再回收。
在1.6的版本中老年代空间使用率阈值(92%)
如果预留的内存不够存放浮动垃圾,就会出现 Concurrent Mode Failure,这时虚拟机将临时启用 Serial Old 来替代 CMS。
会产生空间碎片:标记 - 清除算法会导致产生不连续的空间碎片
Stop The World现象
任何的GC收集器都会进行业务线程的暂停,这个就是STW,Stop The World,所以我们GC调优的目标就是尽可能的减少STW的时间和次数