六、虚拟机堆内存

那个女孩L

已于 2022-11-08 16:24:30 修改

阅读量171

点赞数

分类专栏： jvm虚拟机文章标签： jvm java 算法

于 2022-11-08 16:24:04 首次发布

本文链接：https://blog.csdn.net/weixin_34903543/article/details/127747143

版权

jvm虚拟机专栏收录该内容

6 篇文章 0 订阅

订阅专栏

文章目录

1.堆的核心概述
2.设置堆内存大小与OOM
- 堆空间的大小设置
- OutOfMemoryError 举例
3.年轻代与老年代
4.图解对象分解过程
5.MinorGC、MajorGC、FullGC
6.堆空间的分代思想
7.内存分配策略
8.为对象分配内存：TLAB
9.小结堆空间的参数设置
10.堆是分配对象的唯一选择么？

1.堆的核心概述

在这里插入图片描述

堆的核心概述

一个JVM实例只存在一个堆内存，堆也是Java内存管理的核心区域。
Java堆区在JVM启动的时候即被创建，其空间大小也就确定了，是JVM管理的最大的一块内存空间，堆内存的大小是可以调节的。
《Java虚拟机规范》规定，堆可以处于物理上不连续的内存空间中，但在逻辑上它应该被视为连续的。
所有的线程共享Java堆，在这里还可以划分线程私有缓冲区（Thread Local Allocation Buffer， TLAB）。
《Java虚拟机规范》中对Java堆的描述是：所有的对象实例以及数组都应当运行时分配在堆上。我要说的是：从实际使用角度看，“几乎”所有的对象实例都在这里分配内存。
数组和对象可能永远不会存储在栈上，因为栈帧中保存引用，这个引用指向对象或者数组在堆中的位置。
在方法结束后，堆中的对象不会马上被移除，仅仅在垃圾收集的时候才会被移除。
堆，是GC（Garbage Collection，垃圾收集器）执行垃圾回收的重点区域。
-

堆的核心概述：内存细分

在这里插入图片描述

堆空间内部结构（JDK7）

在这里插入图片描述

堆空间内部结构（JDK8）

在这里插入图片描述

2.设置堆内存大小与OOM

堆空间的大小设置

Java堆区用于存储Java对象实例，那么堆的大小在JVM启动时就已经设定好了，大家可以通过选项 -Xmx 和 -Xms 来进行设置。
- -Xms 用于表示堆内存的起始内存，等价于 -XX:InitialHeapSize
- -Xmx 则用于表示堆区的最大内存，等价于 -XX:MaxHeapSize
一旦堆区中的内存大小超过 -Xmx 所指定的最大内存时，将会抛出 OutOfMemoryError 异常。
通常会将 -Xms 和 -Xmx 两个参数配置相同的值，其目的是为了能够在Java垃圾回收机制清理完堆区后不需要重新计算堆区的大小，从而提高性能。
默认情况下
- 初始内存大小：物理电脑内存大小 / 64
- 最大内存大小：物理电脑内存大小 / 4

OutOfMemoryError 举例

在这里插入图片描述

3.年轻代与老年代

存储在JVM中的Java对象可以被划分为两类：
- 一类是生命周期较短的瞬时对象，这类对象的创建和消亡都非常迅速
- 另外一类对象的生命周期却非常长，在某些极端的情况下还能够与JVM的生命周期保持一致
Java堆区进一步细分的话，可以分为年轻代（YoungGen）和老年代（OldGen）
其中年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间（有时也叫做from区、to区）
配置新生代和老年代在堆结构的占比。
- 默认 -XX:NewRatio=2 ，表示新生代占1，老年代占2，新生代占整堆的1/3
- 可以修改 -XX:NewRatio=4，表示新生代占1，老年代占4，新生代占整堆的1/5
在HotSpot中，Eden空间和另外两个Survivor空间缺省所占的比例是8:1:1
当然开发人员可以通过选项 -XX:SurvivorRatio 调整这个空间的比例。比如 -XX:SurvivorRatio=8
几乎所有的Java对象都是在Eden区被new出来的
绝大部分的Java对象的销毁都在新生代进行了
- IBM公司的专门研究表明，新生代 80% 的对象都是朝生夕死的
可以使用选项 -Xmn 设置新生代最大内存大小
- 这个参数一般使用默认值就可以了

在这里插入图片描述

4.图解对象分解过程

为新对象分配内存是一件非常严谨和负责的任务，JVM的设计者们不仅需要考虑内存如何分配、在哪里分配的问题，并且由于内存分配算法与内存回收算法密切相关，所以还需要考虑GC执行完内存回收后是否会在内存空间产生诶村碎片。

new的对象现房在Eden区，此区有大小限制。
当Eden区的空间填满时，程序又需要创建对象，JVM的垃圾回收器将对Eden区进行垃圾回收（Minor GC），将Eden区的不再被其他对象所引用的对象进行销毁。再加载新的对象放到Eden区。
然后将Eden区中剩余的对象移动到幸存者0区。
如果再次出发垃圾回收，此时上次幸存下来的放到幸存者0区，如果没有回收，就会放到幸存者1区。
如果再次经历垃圾回收，此时会重新放回幸存者0区，接着再去幸存者1区。
啥时候能去养老区呢》可以设置次数，默认是15此。
- 可以设置参数： -XX:MaxTenuringThreshold=N 进行设置
在养老区，相对悠闲，当养老区内存不足时，再次触发GC；Major GC，进行养老区的内存清理。
若养老区执行了Major GC之后发现竟然无法进行对象保存，就会产生OOM 异常。

总结：
- 针对幸存者 s0、s1区的总结：复制之后有交换，谁空谁是to
- 关于垃圾回收：频繁在新生区收集，很少在养老区收集，几乎不在永久区/元空间收集。

在这里插入图片描述
常用的调优工具：
- JDK命令行
- Eclipse: Memory Analyzer Tool
- Jconsole
- VisualVm
- Jprofiler
- Java Flight Recorder
- GCViewer
- GC Easy

5.MinorGC、MajorGC、FullGC

JVM在进行GC时，并非每次都对上面三个内存（新生代、老年代、方法区）区域一起回收的，大部分时候回收的都是新生代。
针对HotSpot VM的实现，它里面的GC按照回收区域又分为两大种类：一种是部分收集（Partila GC），一种是整堆收集（Full GC）

部分收集：不是完整收集整个Java堆的垃圾收集，其中又分为：
- 新生代收集：（Minor GC / Young GC）：只是新生代的垃圾收集。
- 老年代收集：（ - Major GC / Old GC）：只是老年代的垃圾收集。
  - 目前，只有CMS GC会有单独收集老年代的行为。
  - 注意：很多时候Major GC 会和 Full GC 混淆使用，需要具体分辨是老年代回收还是整堆回收。
- 混合收集（Mixed GC）：收集整个新生代以及部分老年代的垃圾收集。
  - 目前，只有G1 GC会有这种行为
整堆收集（Full GC） ：收集整个Java堆和方法区的垃圾收集
年轻代GC（Minor GC）触发的机制：
- 当年轻代空间不足时，就会触发Minor GC，这里的年轻代满指的是Eden区满，Survivor区满不会引发GC。（每次 Minor GC 会清理年轻代的内存）
- 因为Java对象大多数都具备朝生夕死的特性，所以Minor GC非常频繁，一般回收速度也比较快，这一定义既清晰又易于理解。
- Minor GC会引发STW，暂停其它用户的线程，等垃圾回收技术后，用户线程才会恢复运行。
老年代GC(Major GC / Full GC)触发机制：
- 指发生在老年代的GC，对象从老年代小时，我们说 Major GC 或者 Full GC 发生了。
- 出现了Major GC 经常伴随着至少一次的Minor GC （但非绝对，在Parallel Scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程）。
  - 也就是在老年代空间不足时，会先尝试触发Minor GC，如果之后空间还不足，则触发Major GC。
- Major GC 的速度一般比 Minor GC 慢10倍以上，STW时间更长。
- 如果Major GC 后，内存还不足，就报OOM
FUll GC 触发机制：
- 触发Full GC 执行的情况有如下五种：
  1. 调用 System.gc() 时，系统建议执行FUll GC，但是不必然执行。
  2. 老年代空间不足
  3. 方法区空间不足
  4. 通过Minor GC 后进入老年代的平均大小大于老年代的可用内存。
  5. 由Eden区、From区向To区复制时，对象大小大于To Space可用内存，则把对象转到老年代，切老年代的可用内存大小小于该对象大小。
- Full GC 是开发或者调优中尽量要避免的，这样暂停时间会短一些。

6.堆空间的分代思想

在这里插入图片描述

为什么需要把Java堆分代？不分代就不能正常工作了么？

经研究，不同的对象的生命周期不同，70%-99%的对象是临时对象
新生代：有Eden区、两块大小相同的Survivor构成。
老年代：存放新生代中经历多出GC仍然存活的对象。
其实不分代完全可以，分代的唯一理由就是优化GC性能。如果没有分代，那所有的对象都在一起，就如同把一个学校的人都关在一个教室。GC的时候就要找到哪些对象没用，这样就会对堆的所有区域进行扫描，而很多对象都是朝生夕死的，如果分代的话，把新创建的对象放到某一地方，当GC的时候先把这块存储“朝生夕死”对象的区域进行回收，这样就会腾出很大的空间出来。

7.内存分配策略

如果对象在Eden出生并经过第一次Minor GC后仍然存活，并且能被Survivor容纳的话，将被移动到Survivor空间中，并将对象的年龄设为1.对象在Survivor区每熬过一次Minor GC，年龄就增加1岁，当它的年龄增加到一定程度（默认是15岁，其实每个JVM、每个GC都有所不同）时，就会被晋升到老年代中。
对象晋升老年代的年龄阈值，可以通过 -XX:MaxTenuringThrshold 来设置。
针对不同年龄的对象分配原则如下所示：

优先分配到Eden区
大对象直接分配到老年代
- 尽量避免程序中出现过多的大对象
长期存活的对象分配到老年代
动态对象年龄判断
- 如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象可以直接进入老年代，无需等到MaxTenuringTreshold 中要求的年龄
空间分配担保
- -XX:handlePromotionFailure

8.为对象分配内存：TLAB

为什么有TLAB（Thread local Allocation Buffer）

堆区是线程共享区域，任何线程都可以访问到堆中的共享数据
由于对象实例的创建在JVM中非常频繁，因此在并发环境下从堆区中划分内存空间是线程不安全的，
为避免多个线程操作同意地址，需要使用加锁等机制，进而影响分配速度。

什么是TLAB？

从内存模型而不是垃圾收集的角度，对Eden区继续进行划分，JVM为每个线程分配了一个私有的缓存区域，它包含在Eden空间中。
多线程同时分配内存时，使用TLAB可以避免一系列的非线程安全问题，同时还能够提升内存分配的吞吐量，因此我们可以将这种内存分配方式称之为快速分配策略。
据我所知所有OpenJDK衍生出来的JVM都提供了TLAB的设计。

TLAB的再说明

尽管不是所有的对象实例都能够在TLAB中成功分配内存，但JVM确实是将TLAB作为内存分配的首选。
在程序中，开发人员可以通过选项 -XX:UseTLAB 来设置是否开启TLAB空间
默认情况下，TLAB空间的内存非常小，仅占有整个Eden空间的1%，当然我们可以通过选项 -XX:TLABWasteTargetPercent 设置TLAB空间所占有Eden空间的百分比大小
一旦对象在TLAB空间分配内存失败时，JVM就会尝试着通过使用加锁机制确保数据操作的原子性，从而直接在Eden空间中分配内存。

9.小结堆空间的参数设置

在这里插入图片描述

10.堆是分配对象的唯一选择么？

在《深入理解JVM虚拟机》中关于Java堆只内存有这样一段描述：
随着JIT编译器的发展与逃逸分析技术逐渐成熟，栈上分配、标量替换优化技术将会导致一些微妙的变化，所有的对象都分配到堆上也逐渐变得不那么绝对了。
在Java虚拟机中，对象是在Java堆中分配内存的，这是一个普遍的常识，但是有一种特殊情况，那就是如果经过逃逸分析（Escape Analysis）后发现，一个对象并没有逃逸出方法的话，那么就可能被优化成栈上分配，这样就无需在堆上分配内存，也无需进行垃圾回收了，这也是最常见的堆外存储技术
此外，前面提到的基于OpenJDK深度定制的TaoBaoVM，其中创新的GCIH（GC invisible heap）技术实现off-heap，将生命周期较长的Java对象从heap中移至heap外，并且GC不能管理GCIH内部的Java对象，因此达到降低GC的回收频率和提升GC的回收效率的目的。

如何将堆上的对象分配到栈，需要使用逃逸分析手段。
这是一种可以有效减少Java程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。
通过逃逸分析，Java HotSpot 编译期能够分析出一个新的对象的引用的使用范围从而决定是否要讲这个对象分配到堆上。
逃逸分析的基本行为就是分析对象动态作用域：
- 当一个对象在方法中被定义后，对象只在方法内部使用，则认为没有发生逃逸
- 如果一个对象在方法中被定义后，它被外部方法所引用，则认为发生逃逸，例如作为调用参数传递到其他地方中。
  
  参数设置：
在JDK7版本以后，HotSpot中默认就已经开启了逃逸分析。
如果使用是较早的版本，开发人员则可以通过：
- 选项 -XX:+DoEscapeAnalysis 显示开启逃逸分析
- 选项 -XX:+PrintEscapeAnalysis 查看逃逸分析的筛选结果

使用逃逸分析，编译器可以堆代码做如下优化：

栈上分配 ：将堆分配转化为栈分配，如果一个对象在子程序中被分配，要使该对象的指针永远不会逃逸，对象可能是栈分配的候选，而不是堆分配
同步省略：如果一个对象被发现只能从一个线程被访问到，那么对于这个对象的操作可以不考虑同步
分离对象或标量替换：有的对象可能不需要作为一个连续的内存结构存在也可以被访问到，那么对象的部分（或全部）可以不存储在内存，而是存储在CPU寄存器中。

代码优化之栈上分配：

JIT编译器在编译期间根据逃逸分析结果，发现如果一个对象并没有逃逸出方法的话，就可能被优化成栈上分配，分配完成后，继续在调用栈内执行，最后线程结束，栈空间被回收，局部变量对象也被回收，这样就无需进行垃圾回收了。
常见的栈上分配场景：
- 在逃逸分析中，已经说明了，分别是给成员变量赋值、方法返回值、实例引用传递。

代码优化之同步省略（消除）

线程同步的代价是相当高的，同步的后果就是降低并发性
在动态编译同步块时候，JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。如果没有，那么JIT编译器在编译这个同步块的时候就会取消对这部分代码的同步。这样就大大提高了并发性和性能，这个取消同步的过程就叫做同步省略也叫做锁消除。

代码优化之标量替换
标量（Scalar）是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。
相对的，那些还可以分解的数据叫做聚合量（Aggregate），Java中的对象就是聚合量，因为它可以分解成其他聚合量和标量。
在JIT阶段，如果经过逃逸分析，发现一个对象不会被外界访问的haul，那么经过JIT优化，就会把这个对象拆解成若干个其中包含的若干成员变量来代替，这个过程就是标量替换。
在这里插入图片描述

可以看到，Point这个聚合量经过逃逸分析后哦，发现它并没有逃逸，就被替换成两个聚合量了，那么标量替换有什么好处呢？就是可以大大减少堆内存的占用，因为一旦不需要创建对象了，那么久不再需要分配堆内存了。
标量替换为栈上分配提供了很好的基础。
标量替换参数设置：-XX:+EliminateAllocations: 开启标量替换（默认开），允许将对象打散分配在栈上。