JVM性能调优篇03-JVM对象创建与内存分配机制深度剖析

最新推荐文章于 2022-11-14 01:04:27 发布

盲流子开发

最新推荐文章于 2022-11-14 01:04:27 发布

阅读量468

点赞数

分类专栏： JVM性能调优篇文章标签： jvm java linux

本文链接：https://blog.csdn.net/pjsdsg/article/details/125530388

版权

JVM性能调优篇专栏收录该内容

7 篇文章 3 订阅

订阅专栏

对象的创建流程

对象的主要创建流程如下

类加载器加载类
分配内存
初始化
设置对象头
执行init方法

类加载检查

虚拟机遇到new指令时，首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用，并且检查这个符号引用代表的类是否已被加载，解析和初始化过。如果没有，那么必须先执行相应的类加载过程。类加载过程已经在jvm第一篇博客中讲解过，不熟悉类加载过程可以翻一番之前的博客。

分配内存

在类加载检查通过后，接下来虚拟机将为新对象分配内存。对象所需内存的大小在类加载完成之后便可完全确定，为对象分配空间的任务等同于把一块确定大小的内存从堆空间中划分出来。

分配内存有两个问题

如何划分内存
在并发情况下如何划分内存，可能出现正在给对象A分配内存，指针还没来得及修改，对象B又同时使用了原来的指针来分配内存的情况

如何划分内存

划分内存有指针碰撞和空闲列表两种方法。

指针碰撞（Bump the Pointer）(默认使用指针碰撞)
指针碰撞是如果java堆中的内存区域是绝对规整的，所有使用的内存都放在一边，空闲的内存放在另一边，中间放着一个指针作为分界点的指示器，那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。
空闲列表(Free List)
空闲列表是java堆中的内存并不是规整的，已使用内存和空闲的内存相互交错，那就没有办法简单的进行指针碰撞了，虚拟机就必须维护一个空闲列表，记录上哪块内存是可以使用的。在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新空闲列表上的记录。

在这里插入图片描述

并发情况下解决分配内存问题

CAS(compare and swap)
虚拟机采用CAS配上失败重试的方式保证更新操作的原子性来分配内存空间的动作进行同步处理。
就是多个线程都要同时对对象分配内存空间时，分配成功的就成功了，分配失败的进行重试机制。
本地线程分配缓冲(Thread Local Allocation Buffer, TLAB)
把内存分配的动作按照线程划分在不同的空间之中进行，即每个线程在Java堆中预先分配一小块内存。通过-XX:+/-UseTLAB参数来设定虚拟机是否使用TLAB(JVM默认开启-XX:+UserTLAB), -XXTLABSize指定TLAB大小。

初始化

内存分配完成后，虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头)，如果使用TLAB，这一工作过程也可以提前至TLAB分配时进行。这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用，程序能访问到这些字段的数据类型所对应的零值。

设置对象头

初始化之后，虚拟机要对对象进行必要的设置，例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头Object Header之中。

在HotSpot虚拟机中，对象在内存中存储的布局可以分为3块: 对象头(Header)、实例数据(Instance Data)和对象填充(Padding)。HotSpot虚拟机的对象头包括两部分信息，
第一部分Mark Word用于存储对象自身的运行时数据，如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
第二部分是Klass Pointer类型指针，即对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象是哪个类的实例。

Klass Pointer类型指针举例代码


public class Math {

    public static int initData = 666;
    public static User user = new User();


    public int compute(){ // 一个方法对应一块栈帧内存区域
        int a = 1;
        int b = 2;
        int c = (a + b) * 100;
        return c;
    }

    public static void main(String[] args) {
        Math math = new Math();
        math.compute();
        Math math1 = new Math();
        math1.compute();
    }
}

对象指向它的类元数据的指针的意思是，Math类的类元数据存放在在方法区，math对象实例和math1对象实例存放在堆中，这俩实例对象的对象头中都会有一个Klass Pointer类型指针指向Math类在方法区的内存地址。
从类型指针再衍生出上一篇博客中讲解的动态链接，上边代码math对象和math1对象都调用了compute方法，对于我们开发人员来说这俩对象调用的方法的代码都是同一份代码，上一篇博客中讲过这些方法是加载到方法区里了作为Math类的类元信息，当math对象和math1对象都调用了compute方法时会到方法区找对应方法代码的一个位置，那动态链接实际上就是调用对象的方法的时候，从对象的对象头里面的类型指针可以去找到具体的方法代码。
在这里插入图片描述

32位虚拟机下的对象实例结构
在这里插入图片描述
64位虚拟机下的对象实例结构

执行init方法

执行<init方法>，为对象的属性赋值和执行构造方法。

查看对象大小与指针压缩

对象大小可以用jol-core包查看，引入依赖

<dependency>
    <groupId>org.openjdk.jol</groupId>
    <artifactId>jol-core</artifactId>
    <version>0.9</version>
</dependency>

import org.openjdk.jol.info.ClassLayout;

/**
 * 计算对象大小
 */
public class JOLSample {

    public static void main(String[] args) {
        ClassLayout layout = ClassLayout.parseInstance(new Object());
        System.out.println(layout.toPrintable());

        System.out.println();
        ClassLayout layout1 = ClassLayout.parseInstance(new int[]{});
        System.out.println(layout1.toPrintable());

        System.out.println();
        ClassLayout layout2 = ClassLayout.parseInstance(new A());
        System.out.println(layout2.toPrintable());
    }

    // -XX:+UseCompressedOops           默认开启的压缩所有指针
    // -XX:+UseCompressedClassPointers  默认开启的压缩对象头里的类型指针Klass Pointer
    // Oops : Ordinary Object Pointers
    public static class A {
                       //8B mark word
                       //4B Klass Pointer   如果关闭压缩-XX:-UseCompressedClassPointers或-XX:-UseCompressedOops，则占用8B
        int id;        //4B
        String name;   //4B  如果关闭压缩-XX:-UseCompressedOops，则占用8B
        byte b;        //1B 
        Object o;      //4B  如果关闭压缩-XX:-UseCompressedOops，则占用8B
    }
}


运行结果：
java.lang.Object object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)    //mark word
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)    //mark word     
      8     4        (object header)                           e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)    //Klass Pointer
     12     4        (loss due to the next object alignment)
Instance size: 16 bytes
Space losses: 0 bytes internal + 4 bytes external = 4 bytes total


[I object internals:
 OFFSET  SIZE   TYPE DESCRIPTION                               VALUE
      0     4        (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)
      4     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4        (object header)                           6d 01 00 f8 (01101101 00000001 00000000 11111000) (-134217363)
     12     4        (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
     16     0    int [I.<elements>                             N/A
Instance size: 16 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total


com.tuling.jvm.JOLSample$A object internals:
 OFFSET  SIZE               TYPE DESCRIPTION                               VALUE
      0     4                    (object header)                           01 00 00 00 (00000001 00000000 00000000 00000000) (1)
      4     4                    (object header)                           00 00 00 00 (00000000 00000000 00000000 00000000) (0)
      8     4                    (object header)                           61 cc 00 f8 (01100001 11001100 00000000 11111000) (-134165407)
     12     4                int A.id                                      0
     16     1               byte A.b                                       0
     17     3                    (alignment/padding gap)                  
     20     4   java.lang.String A.name                                    null
     24     4   java.lang.Object A.o                                       null
     28     4                    (loss due to the next object alignment)
Instance size: 32 bytes
Space losses: 3 bytes internal + 4 bytes external = 7 bytes total

什么是java对象的指针压缩？

jdk1.6开始，在64位的操作系统中，JVM支持指针压缩
jvm配置参数:UseCompressedOops，compressed–压缩、oop(ordinary object pointer)–对象指针
启用指针压缩:-XX:+UseCompressedOops(默认开启)，禁止指针压缩:-XX:-UseCompressedOops

为什么要进行指针压缩？

在64位平台的HotSpot中使用32位指针(实际存储用64位)，内存使用会多出1.5倍左右，使用较大指针在主内存和缓存之间的移动数据，占用较大带宽，同时GC也会承受较大压力
为了减少64位平台下内存的消耗，启用指针压缩功能
在jvm中，32位地址最大支持4G内存(2的32次方)，可以通过对对象指针的压缩编码、解码方式进行优化，使得jvm只用32位地址就可以支持更大的内存配置(小于等于32G)
堆内存小于4G时，不需要启用指针压缩，jvm会直接去除高32位地址，即使用低虚拟地址空间
堆内存大于32G时，压缩指针会失效，会强制使用64位(即8字节)来对java对象寻址，这就会出现1的问题，所以堆内存不要大于32G为好。

关于对齐填充：对于大部分处理器，对象以8字节整数倍来对齐填充都是最高效的存取方式。

对象内存分配

对象内存分配流程图
在这里插入图片描述
之前的jvm博客中讲解的是，对象分配内存会直接分配到堆内存中，当时是为了好理解，实际上实际场景他不一定会一定会放在堆内存空间中，他会做一个判断，他会判断你这个对象能否在虚拟机的栈内存空间能否分配，如果栈空间分配不下来才会放到堆空间中。

对象在栈上分配

我们通过JVM内存分配可以知道JAVA中的对象都是在堆上进行分配，当对象没有被引用的时候，需要靠GC进行回收内存，如果对象过多的时候，会给GC带来较大压力，也间接影响了应用的性能。为了减少临时对象在堆内存分配的数量，JVM通过逃逸分析确定该对象不会被外部访问。如果不会逃逸可以将该对象在栈上分配内存，这样该对象所占用的内存空间就可以随栈帧出栈而销毁，就减轻了垃圾回收的压力。

对象逃逸分析：就是分析对象动态作用域，当一个对象在方法中被定义后，它可能被外部方式所引用，例如作为调用参数传递到其他地方中。以以下代码为示例

public User test1(){
        User user = new User();
        user.setName("张三");
        return user;
    }
    
    public void test2(){
        User user = new User();
        user.setName("李四");
    }

很显然test1方法中user对象被返回了，这个对象的作用域范围不确定，test2方法中user对象我们可以确定当方法结束这个对象就可以认为是无效对象了，对于这样的对象我们其实可以将其分配在栈内存里，让其在方法结束时跟随栈内存一起被回收掉。
JVM对于这种情况可以通过开启逃逸分析参数(-XX:+DoEscapeAnalysis)来优化对象内存分配位置，使其通过标量替换优先分配在栈上(栈上分配)，JDK7之后默认开启逃逸分析，如果要关闭使用参数(-XX:-DoEscapeAnalysis)

标量替换：通过逃逸分析确定该对象不会被外部访问，并且对象可以被进一步分解时，JVM不会创建该对象，而是将该对象成员变量分解成若干个被这个方法使用的成员变量所代替，这些代替的成员变量在栈帧或寄存器上分配空间，这样就不会因为没有一大块连续空间导致对象内存不够分配。开启标量替换参数(-XX:+EliminateAllocations)，JDK7之后默认开启。因为线程栈的内存区域比较小，而且要存放很多信息，有可能连续的大的内存区域不多，所以设计成了这种模式。

标量与聚合量：标量即不可被进一步分解的量，而JAVA的基本数据类型就是标量(如：int,long等基本数据类型以及reference类型等)，标量的对立就是可以被进一步分解的量，而这种量称之为聚合量。而在JAVA中对象就是可以被进一步分解的聚合量。

用以下代码来演示一下对象在栈内存空间分配内存,可以自己测试

/**
 * 栈上分配，标量替换
 * 代码调用了1亿次alloc()，如果是分配到堆上，大概需要1GB以上堆空间，如果堆空间小于该值，必然会触发GC。
 *
 * 使用如下参数不会发生GC
 * 最大堆内存 15MB 堆空间初始大小15M 开启逃逸分析 开启GC打印 开启标量替换
 * -Xmx15m -Xms15m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
 *
 * 使用如下参数都会发生大量GC
 * 最大堆内存 15MB 堆空间初始大小15M 关闭逃逸分析 开启GC打印 开启标量替换
 * -Xmx15m -Xms15m -XX:-DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
 * 最大堆内存 15MB 堆空间初始大小15M 开启逃逸分析 开启GC打印 关闭标量替换
 * -Xmx15m -Xms15m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:-EliminateAllocations
 */
public class AllotOnStack {


    public static void main(String[] args) {
        long start = System.currentTimeMillis();
        for (int i =0; i< 100000000; i++){
            alloc();
        }
        long end = System.currentTimeMillis();
        System.out.println(end - start);
    }

    private static void alloc(){
        User user = new User();
        user.setName("李四");
    }
}

结论：栈上分配依赖于逃逸分析和标量替换

对象在堆中分配空间

大多数情况下，对象在新生代的Eden区分配。当Eden区没有足够空间进行分配时，虚拟机将发起一次Minor GC。

Minor GC: 指发生年轻代的垃圾收集动作，Minor GC非常频繁，回收速度一般也比较快。
Full GC：一般会回收老年代，年轻代，方法区的垃圾，Full GC的速度一般会比Minor GC的慢10倍以上。

Eden区和Survivor区默认8:1：1
大量的对象被分配在Eden区，Eden区满了以后会触发minor gc，可能会有99%以上的对象成为垃圾被回收掉，剩余存活的对象会被挪到为空的那块survivor区，下一代Eden区满了以后又会触发minor gc，把Eden区和survivor区垃圾对象回收，把剩余存活的对象一次性挪动到另外一块为空的survivor区，因为新生代的对象都是朝生夕死的，存活时间很短，所以JVM默认的8:1:1的比例是很合适的，让eden区尽量的大，survivor区够用即可。

JVM中默认有这个参数-XX:+UseAdaptiveSizePolicy(默认开启)，会导致这个8:1:1比例自动变化，如果不想这个比例有变化可以设置参数-XX:-UseAdaptiveSizePolicy

当对象在栈内存空间分配失败，那么就会到堆内存空间进行分配。分配到堆内存空间会判断该对象是否是大对象，大对象直接放到老年代，不是大对象会放到年轻代的Eden区域。

测试一下是否大对象是否直接放到了老年代中

//添加运行JVM参数： -XX:+PrintGCDetails
public class GCTest {


    public static void main(String[] args) {
        byte[] allocation1;

        allocation1 = new byte[60000 * 1024]; // allocation1对象初始化6M内存大小
    }
}

// 代码运行输出结果
Heap
 PSYoungGen      total 75776K, used 6517K [0x000000076bd80000, 0x0000000771200000, 0x00000007c0000000)
  eden space 65024K, 10% used [0x000000076bd80000,0x000000076c3dd4b8,0x000000076fd00000)
  from space 10752K, 0% used [0x0000000770780000,0x0000000770780000,0x0000000771200000)
  to   space 10752K, 0% used [0x000000076fd00000,0x000000076fd00000,0x0000000770780000)
 ParOldGen       total 173568K, used 60000K [0x00000006c3800000, 0x00000006ce180000, 0x000000076bd80000)
  object space 173568K, 34% used [0x00000006c3800000,0x00000006c7298010,0x00000006ce180000)
 Metaspace       used 3221K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 350K, capacity 388K, committed 512K, reserved 1048576K

执行结果发现ParOldGen 区域user为60000k，那么allocation1 对象直接进入了老年代。

大对象直接进入老年代

大对象就是需要大量连续内存空间的对象（比如：字符串、数组）。JVM参数-XX:PretenureSizeThreshold 可以设置大对象的大小，如果对象超过设置大小会直接进入老年代，不会进入年轻代，这个参数只在Serial 和ParNew两个收集器下有效。
比如设置JVM参数：-XX:PretenureSizeThreshold=1000000 (单位是字节) -XX:+UseSerialGC ，再执行下上面的第一个程序会发现大对象直接进了老年代
为什么要这样呢？
为了避免为大对象分配内存时的复制操作而降低效率，因为minor gc之后当对象的分代年龄到达15时才会进入老年代，大对象在Survivor区域中来回复制是非常好资源的，所以大对象直接进入老年代是个很好的提升性能的办法。

长期存活的对象进入老年代

既然虚拟机采用了分代收集的思想和管理内存，那么内存回收时就必须能识别哪些对象应放在新生代，哪些对象应放在老年代。为了做到这一点，虚拟机给每个对象一个对象年龄计数器（分代年龄）。
如果对象在 Eden 出生并经过第一次 Minor GC 后仍然能够存活，并且能被 Survivor 容纳的话，将被移动到 Survivor 空间中，并将对象年龄设为1。对象在 Survivor 中每熬过一次 MinorGC，年龄就增加1岁，当它的年龄增加到一定程度（默认为15岁，CMS收集器默认6岁，不同的垃圾收集器会略微有点不同），就会被晋升到老年代中。对象晋升到老年代的年龄阈值，可以通过参数 -XX:MaxTenuringThreshold 来设置。

对象动态年龄判断(很重要)

当Eden区占满之后，执行minor gc时，Survivor区的对象年龄从小到大进行累加，当累加到X年龄（某个年龄）时占用空间的总和大于50%（可以使用-XX:TargetSurvivorRatio=?来设置保留多少空闲空间，默认值是50），那么比X年龄大的对象都会晋升到老年代；对象动态年龄机制一般是在minor gc之后触发的

看看hotspot的对象动态年龄判断机制的源代码(C++)

uint ageTable::compute_tenuring_threshold(size_t survivor_capacity) {
    //survivor_capacity是survivor空间的大小
  size_t desired_survivor_size = (size_t)((((double) survivor_capacity)*TargetSurvivorRatio)/100);
  size_t total = 0;
  uint age = 1;
  while (age < table_size) {
    total += sizes[age];//sizes数组是每个年龄段对象大小
    if (total > desired_survivor_size) break;
    age++;
  }
  uint result = age < MaxTenuringThreshold ? age : MaxTenuringThreshold;
    ...
}

代码中有一个TargetSurvivorRatio的值。
-XX:TargetSurvivorRatio (目标存活率，默认为50%)
根据代码可以看到，动态年龄计算方式为：

通过这个比率来计算一个期望值，desired_survivor_size 。
然后用一个total计数器，累加每个年龄段对象大小的总和。
当total大于desired_survivor_size 停止。
然后用当前age和MaxTenuringThreshold 对比找出最小值作为结果。

总体表征就是，年龄从小到大进行累加，当加入某个年龄段后，累加和超过survivor区域*TargetSurvivorRatio的时候，就从这个年龄段网上的年龄的对象进行晋升。

举例当年龄1的对象占用了33%，年龄2的对象占用33%，年龄3的对象占用34%。根据上面的场景，年龄1的占用了33%，年龄2的占用了33%，累加和超过默认的TargetSurvivorRatio（50%），年龄2和年龄3的对象都要晋升到老年代。
动态对象年龄判断，主要是被TargetSurvivorRatio这个参数来控制。而且算的是年龄从小到大的累加和，而不是某个年龄段对象的大小。

为了避免这种情况可以将放大年轻代的内存空间大小，年轻代越大，Survivor区域才会越大，这样就能避免对象动态年龄判断机制，避免对象提前进入老年代。老年代进入的越晚full gc执行的越晚，这样应用性能才会提高。

老年代空间分配担保机制

JVM底层还有一个特殊的触发full gc的机制。

年轻代每次minor gc之前JVM都会计算下老年代剩余可用空间
如果这个可用空间小于年轻代里现有的所有对象大小之和(包括垃圾对象)
就会看一个“-XX:-HandlePromotionFailure”(jdk1.8默认就设置了)的参数是否设置了
如果有这个参数，就会看看老年代的可用内存大小，是否大于之前每一次minor gc后进入老年代的对象的平均大小。
如果上一步结果是小于或者之前说的参数没有设置，那么就会触发一次Full gc，对老年代和年轻代一起回收一次垃圾，如果回收完还是没有足够空间存放新的对象就会发生"OOM"
当然，如果minor gc之后剩余存活的需要挪动到老年代的对象大小还是大于老年代可用空间，那么也会触发full gc，full gc完之后如果还是没有空间放minor gc之后的存活对象，则也会发生“OOM”
在这里插入图片描述

对象内存回收

堆中几乎放着所有的对象实例，对堆垃圾回收前的第一步就是要判断哪些对象已经死亡（即不能再被任何途径使用的对象）。
将“GC Roots” 对象作为起点，从这些节点开始向下搜索引用的对象，找到的对象都标记为非垃圾对象，其余未标记的对象都是垃圾对象
GC Roots根节点：线程栈的本地变量、静态变量、本地方法栈的变量等等