Java虚拟机精讲之内存分配与垃圾回收

最新推荐文章于 2021-02-22 02:19:35 发布

weixin_34082789

最新推荐文章于 2021-02-22 02:19:35 发布

阅读量68

点赞数

原文链接：https://my.oschina.net/tjt/blog/750380

版权

为什么80%的码农都做不了架构师？>>>

1 线程共享内存区

Java堆区

用于存储Java对象实例,但是不一定是Java对象内存分配的唯一选择(为了降低GC频率).在JVM启动的时候大小就已经设定好了.(-Xmx最大 -Xms起始) 超过最大内存的时候,抛出OOM异常.
实际的内存空间可以不连续,是GC的重点区域.
YoungGen新生代(Eden, From Survivor, To Survivor) ; OldGen老年代(OldGen).根据不同的代选择不同的GC算法.

方法区

存储了每一个Java类的结构信息,比如 运行时常量池 , 字段和方法数据 , 构造函数 , 普通方法的字节码内容 以及 类,实例,接口初始化时要用到的特殊方法等数据.
jvm规范没有对方法区的实现有明确要求,在HotSpot中,它属于Java堆区的一部分
在JVM启动的时候创建,也可以不连续,有时候被称为永久代,它不会频繁的GC,但是不代表它里面数据永远不会被回收.如果没有显示要求不对方法区进行内存回收的情况下,GC的回收目标仅针对方法区的常量池和类型卸载
超过-XX:Max-PermSize也会OOM

运行时常量池

属于方法区的一部分.运行时常量池就是字节码文件中常量池表的运行时表示形式.
当类加载器成功的将一个类或者接口装载进JVM后,就会创建与之对应的运行时常量池.

2 线程私有内存区

PC寄存器

无OOM
为什么每个线程都要?答:CPU做任务切换,每个线程都要记录正在执行的当前字节码指令地址,从而每个线程都可以独立计算.
JVM的解释器需要通过改变PC寄存器的值来明确下一条有关执行什么样的字节码指令

Java栈(Java虚拟机栈)

Java栈用于存储栈帧,生命周期和线程的生命周期一致
对应Java堆中存储对象,Java栈中局部变量表用于存储各类原始数据类型,对象引用,以及returnAdress类型.

3 自动内存管理

内存分配原理

jvm包含三种引用了类型:类类型,数组类型,接口类型,分别对应创建的值是类实例, 数组实例, 以及实现了某个接口的派生类实例.
下图是jvm中具体的创建对象实例
分配内存有指针碰撞(已用的未用的分两边,通过修改中间指针的偏移量) 和空闲列表(Free List)

堆区和方法区

堆区和方法区是线程共享,在并发环境下从堆区中划分内存空间是非线程安全的.所以一个类如果在分配内存之前已经成功完成类装载步骤之后,JVM会优先选择在TLAB(本地线程分配缓冲区,是堆区中一块线程私有的区域,包含在Eden空间内,缺省很小,占Eden的1%,可以通过参数调整),可以避免一系列的非线程安全问题,还能提升内存分配的吞吐量.这种内存分配方式叫做快速分配策略.(-XX:UseTLAB)
一旦对象在TLAB空间分配内存失败,JVM会尝试通过加锁来确保原子性,从而直接在Eden分配内存.
分配好内存空间后,接下来就是初始化对象实例,首先对分配的内存空间进行零值初始化,再接下来是初始化对象头和实例数据.到这里,一个Java对象实例才是真正的创建成功.

逃逸分析与栈上分配

一个对象被定义在方法体内部之后,一旦其应用被外部成员引用,这个对象就发生了逃逸,反之,JVM就会为其在栈帧中分配内存空间(这是优化技术)

public class StackAllocation {
  public StackAllocation obj;

  //逃逸
  public StackAllocation getStackAllocation() {
    return null == obj ? new StackAllocation() : obj;
  }

  //为成员变量赋值,逃逸
  public void setStackAllocation() {
    obj = new StackAllocation();
  }

  //引用成员变量的值,逃逸
  public void useStackAllocation1() {
    StackAllocation obj = getStackAllocation();
  }

  //对象的作用于仅在方法体内,未逃逸
  public void useStackAllocation2() {
    StackAllocation obj = new StackAllocation;
  }
}

对象内存布局与OOP-Klass模型

GC算法和垃圾收集器

GC(Garbage Collector 垃圾收集器),其实内存划分(新生代,老年代)是完全依赖于GC的设计.当内存空间中的内存消耗达到一定的阈值之后,GC会进行垃圾回收.
可以根据以下6点评估一款GC的性能

吞吐量:程序的运行时间/(程序的运行时间 + 内存回收的时间)
垃圾收集开销
暂停时间
收集频率
堆空间:java堆区锁占用的内存大小
快速:一个对象从诞生到被垃圾回收所经历的时间.

垃圾标记: 根搜索算法

一般不用引用计数法.无法解决死亡对象的互相引用导致无法垃圾回收,所以HotSpot使用根搜索算法,只有能够被根对象集合直接或者间接连接的对象才是存活对象.当目标对象不可达的时候,便可以在instanceOopDesc的MarkWord中将其标记为垃圾对象.
根对象集合:

Java栈中的对象引用
本地方法栈中的对象引用
运行时常量池中的对象引用
方法区中类静态属性的对象引用(所以这个要注意静态变量的定义!)
与一个类对应的唯一数据类型的Class对象

垃圾回收:分代收集算法

上一步成功的区分出了存活和死亡对象.接下来就是垃圾回收算法.

标记-清除算法(Mark-Sweep)

把垃圾回收任务分为两个阶段,分别是垃圾回收和内存释放.简单,但是效率低下,而且会产生内存碎片

复制算法(Copying)

就是因为这个算法,所以内存是分代的!
java的大多数对象都是瞬时对象,生命周期非常短.复制算法广泛用于新生代中.新生代分为Eden,From Suvivor和To Suvivor,Eden和另外两个Survior空间缺省所占比例为8:1,可以通过-XX:SurvivorRatio调整.
当执行一次Minor GC,Eden中存活的对象会被复制到To Suvivor空间内,并且之前经历过一次Minor GC并在From Suvivor存活下来的对象如果还年轻的话会被复制到To Suvivor.
满足两种特殊情况,Eden和From空间的存活对象不会被复制到To空间.

存活的对象的分代年龄超过-XX:MaxTenuringThreshold所指的的阈值时,会直接晋升到老年代中.
当To空间的容量达到阈值的时候,存活的对象也会直接晋升到老年代中

当执行完Minor GC之后,Eden空间和From空间将会被清空,存活下来的对象会全部存在To空间内,接下来From空间和To空间将会互换位置(无非就是使用To空间作为一个临时的空间交换角色,所以务必保证一个survivor空间是空的)
不适用与老年代中的内存回收,因为老年代中的对象的生命周期都比较长,所以会有很多的复制,效率和效果都不太好

标记-压缩算法(Mark-Compact)

适用于老年代
当标记出垃圾对象之后,会将所有的存活对象移动到一个规整且连续的空间,然后执行Full GC(Major GC),垃圾回收之后,已用和未用的内存都各自一边.

总结

新生代的GC算法一速度优先,新生代的对象生命周期都非常短暂,内存空间也比较小.所以这块的垃圾回收会非常频繁.
老年代的GC算法使用更节省内存的算法,老年代的对象生命周期都比较长,并且老年代占了绝大部分的堆空间.

垃圾收集器

上面说的是JVM的内存回收算法,接下来说的是GC的具体实现.有许多的GC版本,比如:Serial/Serial Old,Parallel/Parallel Old,CMS,G1
这些新生代和老年代的GC算法可以自由组合
两个非常重要的概念:串行还是并行回收,并发还是"Stop-the-World"机制
串行回收简单来说旧书多个CPU可以用时,也只有一个CPU用于垃圾回收操作,并且在执行垃圾回收的时候,程序中的工作线程会被暂停(注意这个的区别),串行回收缺省在Client模式下的JVM.并行收集可以运用多个CPU同时进行垃圾收集,提升了吞吐量,但是还是要"STW",这个一定要注意.
第二个概念是说的是回收的时候,要不要stw的,最新的G1也做不到完全不需要STW.

串行回收:Serial收集器

用于新生代,采用复制算法,串行回收和STW.是Client下的缺省新生代GC
Serial Old 采用标记-压缩算法,其他一样.
-XX:+UseSerialGC

并行回收:ParNew收集器

用并行方式执行内存回收,其他和Seial几乎没有区别.在单个cpu下,ParNew不见得会比Serial高效
在某些注重低延迟的应用场景中,ParNew+CMS(Concurrent-Mark-Sweep)收集器组合执行Server模式下的内存回收几乎是最佳的选择.
-XX:+UseParNewGC

程序吞吐量优先:Parallel收集器

复制算法,并行回收和STW,
和ParNew最大的不通是Parallel可以控制程序的吞吐量大小.
-XX:GCTimeRatio 设置内存回收的时间所占JVM运行总时间的比例(也就是控制GC的执行频率,公式为1/(1+N),默认值是99,也就是说将只有1%的时间用于执行垃圾回收)
-XX:MaxGCPauseMillis设置STW的暂停时间阈值,如果指定了该选项,Parallel收集器将会尽可能地在指定时间范围完成内存回收.
注意!吞吐量和低延迟这两个目标其实是存在相互竞争的矛盾,如果选择吞吐量优先,就会降低内存回收的执行频率,这会导致GC需要更长的暂停时间来执行垃圾回收.如果选择以低延迟优先,那么为了降低每次GC的时间,只能更加频繁的进行GC,这会导致吞吐量下降.
-XX:UseAdaptiveSizePolicy 用于甚至GC的自动分代大小调整策略,这个JVM就是自动调整相关参数
Parallel Old采用标记-压缩算法,Parallel+parallel Old是个不错的选择

低延迟:CMS(Concurrent-Mark-Sweep)

是优秀的老年代收集器,采用标记-清除算法,也会stw
有以下阶段:

初始标记阶段
并发标记阶段
再次标记阶段,因为工作线程和垃圾回收线程共同工作,所以需要再次标记.所以不可避免的还是会有漏网之鱼
并发清除阶段

由于采用标记-清除(一般老年代采用标记压缩),所以不可避免的会有内存碎片,所以使用CMS为新对象分配内存空间的时候,将无法使用指针碰撞技术,只能选择空闲列表进行内存分配
-XX:+UseCMSCompactAtFullCollection,用于在执行完指定的FullGC之后是否对内存空间进行压缩整理.
-XX:CMSFullGCsBeforeCompaction 用于设置执行多少次Full GC之后对内存空间进行压缩整理
一个要纠正的点是 Full-GC是遍布整个堆空间的,不只是在老年代中.而CMS可以提供-XX:CMSInitiatingOccupancyFraction用于设置当老年代的内存使用率达到多少的时候执行内存回收.(缺省92%) 注意 这里的内存回收仅限于老年代,所以可以有效的降低FullGC的次数