三、理解JVM对象的创建与内存分配机制

三、理解JVM对象的创建与内存分配机制

1、对象的创建

  • 对象创建的主要流程
    • image-20220420141129180
  1. 类加载检查

    • 虚拟机遇到一条 new 指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
  2. 分配内存

    • 在类加载检查通过后,虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后可以确定,为对象分配空间就是把 一块确定大小的内存从Java堆中划分出来。

    • 分配内存需要注意的两个问题:

      1. 划分内存的方法:

        • “指针碰撞”(Bump the Pointer)(默认用指针碰撞)

          即 Java 堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。

        • “空闲列表”(Free List)

          即 Java 堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,JVM 虚拟机就必须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例, 并更新列表上的记录。

      2. 解决并发问题的方法:

        • CAS(compare and swap)

          虚拟机采用CAS配上失败重试的方式保证更新操作的原子性来对分配内存空间的动作进行同步处理。

        • 本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)

          即每个线程在 Java 堆中预先分配一小块内存。通过 -XX:+/-UseTLAB 参数来设定虚拟机是否使用 TLAB ( JVM会默认开启-XX:+UseTLAB ),-XX:TLABSize 指定TLAB大小。

        • JVM 虚拟机采用 TLAB + CAS 的方式分配内存。即每个线程在分配内存时先会分配在自己预内存上,如果自己的预内存分配完了,再分配到公共内存中,此时发生并发才采用 CAS 进行分配。

  3. 初始化零值

    • 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头)。这一步操作保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
  4. 设置对象头

    • 初始化零值之后,JVM 虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头Object Header之中。
    • 在 HotSpot 虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、 实例数据(Instance Data)和对齐填充(Padding)。 HotSpot 虚拟机的对象头包括两个部分信息,第一部分用于存储对象自身的运行时数据(Mark Word), 如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时 间戳等。对象头的另外一部分是类型指针(Klass Pointer),即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
    • 32位对象内部存储布局
      • image-20220420141600326
    • 64位对象头
      • image-20220420141721085
  5. 执行方法

    • 执行方法,即对象按照程序员的意愿进行初始化。即为属性赋值(这是由程序员赋的值),和执行构造方法。

2、对象大小与指针压缩

  • 什么是 java对象 的指针压缩
    • JDK1.6 update14 开始,在 64bit 操作系统中,JVM支持指针压缩
    • JVM配置参数:UseCompressedOops,compressed—压缩、oop(ordinary object pointer)—对象指针
    • 启用指针压缩:-XX:+UseCompressedOops(默认开启),禁止指针压缩:-XX:-UseCompressedOops
  • 为什么要进行指针压缩?
    • 在 jJVM 中,32位地址最大支持4G内存(2的32次方),可以通过对对象指针的存入堆内存时压缩编码、取出到 CPU 寄存器后解码方式进行优化(对象指针在堆中是32位,在寄存器中是35位,2的35次方=32G),使得jvm只用32位地址就可以支持更大的内存配置(小于等于32G)
    • 堆内存小于4G时,不需要启用指针压缩,jvm会直接去除高32位地址,即使用低虚拟地址空间
    • 堆内存大于32G时,压缩指针会失效,会强制使用64位(即8字节)来对java对象寻址,所以堆内存不要大于32G为好。
  • 对齐填充
    • 对于大部分处理器,对象以8字节整数倍来对齐填充都是最高效的存取方式。

3、对象内存分配

  • 对象内存分配主要流程

    • image-20220420142840008
  • 对象栈上分配

    • 通过 JVM 内存分配可以知道 Java 中的对象都是在堆上进行分配,当对象没有被引用的时候,需要依靠GC进行回收内存,如果对象数量较多的时候,会给GC带来较大压力,也间接影响了应用的性能。为了减少临时对象在堆内分配的数量,JVM 通过逃逸分析确定该对象不会被外部访问。如果不会逃逸可以将该对象在栈上分配内存,这样该对象所占用的内存空间就可以随栈帧出栈而销毁,就减轻了垃圾回收的压力。

    • 对象逃逸分析

      • 分析对象动态作用域,当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他地方中。

      • public User test1() {
           User user = new User();
           user.setId(1);
           user.setName("zhuge");
           return user;
        }
        
        public void test2() {
           User user = new User();
           user.setId(1);
           user.setName("zhuge");
        }
        
      • 很显然 test1 方法中的 user 对象被返回了,这个对象的作用域范围不确定,test2 方法中的 user 对象我们可以确定当方法结束这个对象就可以认为是无效对象了,对于这样的对象我们其实可以将其分配在栈内存里,让其在方法结束时跟随栈内存一起被回收掉。

      • JVM 对于这种情况可以通过开启逃逸分析参数 ( -XX:+DoEscapeAnalysis ) 来优化对象内存分配位置,使其通过 标量替换 优先分配在栈上( 栈上分配 ),JDK7之后默认开启逃逸分析,如果要关闭使用参数(-XX:-DoEscapeAnalysis)

      • 标量替换:通过逃逸分析确定该对象不会被外部访问,并且对象可以被进一步分解时,JVM 不会创建该对象,而是将该对象成员变量分解若干个被这个方法使用的成员变量所代替,这些代替的成员变量在栈帧或寄存器上分配空间,这样就不会因为没有一大块连续空间导致对象内存不够分配。开启标量替换参数(-XX:+EliminateAllocations),JDK7之后默认开启

      • **标量与聚合量:**标量即不可被进一步分解的量,而JAVA的基本数据类型就是标量(如:int,long等基本数据类型以及reference类型等),标量的对立就是可以被进一步分解的量,而这种量称之为聚合量。而在JAVA中对象就是可以被进一步分解的聚合量。

  • 对象在Eden区分配

    • 对象在新生代中 Eden 区分配。当 Eden 区没有足够空间进行分配时,虚拟机将发起一次Minor GC。
      • Minor GC/Young GC:指发生新生代的的垃圾收集动作,Minor GC非常频繁,回收速度一般也比较快。
      • Major GC/Full GC:一般会回收老年代 ,年轻代,方法区的垃圾,Major GC 的速度一般会比 Minor GC 的慢10倍以上。
    • 大量的对象被分配在 eden 区,eden 区满了后会触发 minor gc,可能会有99%以上的对象成为垃圾被回收掉,剩余存活的对象会被挪到为空的那块 survivor 区,下一次 eden 区满了后又会触发 minor gc,把eden 区和 survivor 区垃圾对象回收,把剩余存活的对象一次性挪动到另外一块为空的 survivor 区,因为新生代的很多对象都是朝生夕死的,存活时间很短,所以JVM默认的 8:1:1 的比例是很合适的,让eden区尽量的大,survivor区够用即可,
      • JVM 默认有这个参数-XX:+UseAdaptiveSizePolicy(默认开启),会导致这个 8:1:1 比例自动变化,如果不想这个比例有变化可以设置参数-XX:-UseAdaptiveSizePolicy。
  • 大对象直接进入老年代

    • 大对象就是需要大量连续内存空间的对象(比如:字符串、数组)。
    • JVM参数 -XX:PretenureSizeThreshold 可以设置大对象的大小,如果对象超过设置大小会直接进入老年代,不会进入年轻代,这个参数只在 Serial 和 ParNew 两个收集器下有效
  • 长期存活的对象将进入老年代

    • 虚拟机采用了分代收集的思想来管理内存,那么内存回收时就必须能识别哪些对象应放在新生代,哪些对象应放在老年代中。虚拟机给每个对象一个对象年龄(Age)计数器。
    • 如果对象在 Eden 出生并经过第一次 Minor GC 后仍然能够存活,并且能被 Survivor 容纳的话,将被移动到 Survivor 空间中,并将对象年龄设为1。对象在 Survivor 中每熬过一次 MinorGC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁,CMS收集器默认6岁,不同的垃圾收集器会略微有点不同),就会被晋升到老年代中。对象晋升到老年代的年龄阈值,可以通过参数 -XX:MaxTenuringThreshold 来设置。
  • 对象动态年龄判断

    • 当前放对象的 Survivor 区域里( 其中一块区域,放对象的那块 Survivor 区 ),一批对象的总大小大于这块Survivor 区域内存大小的50% ( -XX:TargetSurvivorRatio可以指定 ),那么此时大于等于这批对象年龄最大值的对象,就可以直接进入老年代了,例如 Survivor 区域里现在有一批对象,年龄1+年龄2+年龄n的多个年龄对象总和超过了Survivor区域的50%,此时就会把年龄n(含)以上的对象都放入老年代。这个规则其实是希望那些可能是长期存活的对象,尽早进入老年代。对象动态年龄判断机制一般是在minor gc之后触发的。
  • 老年代空间分配担保机制

    • image-20220420144905703
    1. 年轻代每次 minor gc 之前 JVM 都会计算下老年代剩余可用空间。如果这个可用空间小于年轻代里现有的所有对象大小之和 (包括垃圾对象),就会看一个“-XX:-HandlePromotionFailure”(jdk1.8默认就设置了)的参数是否设置了。
    2. 如果有这个参数,就会看看老年代的可用内存大小,是否大于之前每一次 minor gc 后进入老年代的对象的平均大小。
    3. 如果上一步结果是小于或者之前说的参数没有设置,那么就会触发一次Full gc,对老年代和年轻代一起回收一次垃圾,如果回收完还是没有足够空间存放新的对象就会发生"OOM"。
    4. 当然,如果minor gc之后剩余存活的需要挪动到老年代的对象大小还是大于老年代可用空间,那么也会触发full gc,full gc完之后如果还是没有空间放minor gc之后的存活对象,则也会发生“OOM”。
  • 对象内存回收

    • 堆中几乎放着所有的对象实例,对堆垃圾回收前的第一步就是要判断哪些对象已经死亡(即不能再被任何途径使用的对象)。
    • 判断对象死亡的方法有两种:
      1. 引用计数法
        • 给对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1;当引用失效,计数器就减1;任何时候计数器为0的对象就是不可能再被使用的。
        • 这个方法实现简单,效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因是它很难解决对象之间相互循环引用的问题。
      2. 可达性分析算法
        • GC Roots 对象作为起点,从这些节点开始向下搜索引用的对象,找到的对象都标记为非垃圾对象,其余未标记的对象都是垃圾对象。
        • GC Roots 根节点:线程栈的本地变量、静态变量、本地方法栈的变量等等
        • image-20220420145134504
  • 常见引用类型

    • Java 的引用类型一般分为四种:强引用软引用、弱引用、虚引用

      • 强引用:普通的变量引用

        public static User user = new User();
        
      • 软引用:将对象用SoftReference软引用类型的对象包裹,**正常情况不会被回收,但是GC做完后发现释放不出空间存放新的对象,则会把这些软引用的对象回收掉。**软引用可用来实现内存敏感的高速缓存。

        public static SoftReference<User> user = new SoftReference<User>(new User());
        
      • 弱引用:将对象用WeakReference软引用类型的对象包裹,弱引用跟没引用差不多,GC会直接回收掉,很少用

        public static WeakReference<User> user = new WeakReference<User>(new User());
        
      • 虚引用:虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系,几乎不用。

  • 如何判断一个类是无用的类

    • 方法区主要回收的是无用的类,类需要同时满足下面3个条件才能算是 “无用的类”
      • 该类所有的对象实例都已经被回收,也就是 Java 堆中不存在该类的任何实例。
      • 加载该类的 ClassLoader 已经被回收。
      • 该类对应的 java.lang.Class 对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
    • 我们一般写的类都是由AppClassLoader加载的,所以说类一般不会被回收。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
JVM内存结构: JVM内存分为如下五个部分: 1. 程序计数器 程序计数器是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。每个线程都有一个程序计数器,是线程私有的,生命周期与线程相同。 2. Java虚拟机栈 Java虚拟机栈也是线程私有的,生命周期与线程相同。每个方法执行的时候,JVM都会同步创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。方法调用结束后,相应的栈帧也会被销毁。 3. 本地方法栈 本地方法栈也是线程私有的,它与Java虚拟机栈的作用非常相似,只不过它是为虚拟机使用到的Native方法服务。 4. JavaJava堆是JVM所管理的内存中最大的一块,也是所有线程共享的。Java堆是用于存储对象实例的内存区域,几乎所有的对象实例都在这里分配内存。Java堆是垃圾收集器管理的重点区域,也被称为GC堆。 5. 方法区 方法区也是线程共享的,用于存储已被JVM加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。在JDK8之前,永久代(PermGen)是方法区的一部分。在JDK8时,永久代被彻底移除,使用了元空间(Metaspace)来代替。 内存分配策略: JVM内存分配策略主要有以下几种: 1. 对象优先在Eden区分配 当JVM需要为新的对象分配内存时,会优先在Eden区进行分配。如果Eden区没有足够的空间,JVM会通过Minor GC回收部分内存空间。 2. 大对象直接进入老年代 如果要分配的对象大小超过了Eden区的一半,JVM会直接将该对象分配到老年代。这样做的目的是为了避免在Eden区内产生大量的垃圾对象,从而降低了Minor GC的频率。 3. 长期存活的对象进入老年代 JVM会为每个对象定义一个年龄计数器,当一个对象在Eden区经历了一次Minor GC后仍然存活,会被移动到Survivor区。在Survivor区中,对象会被继续观察,如果其存活时间达到了一定的阈值,就会被晋升到老年代中。这样做的目的是为了保证长期存活的对象能够在老年代中有足够的空间进行分配。 4. 空间分配担保 每次进行Minor GC时,JVM都会检查老年代的可用空间是否足够,如果足够,就可以安全地将所有存活的对象晋升到老年代中。如果不足,JVM会检查这次Minor GC之前的晋升到老年代的对象的平均大小与老年代的剩余空间的比值,如果比值大于某个阈值(通常为50%),那么这次Minor GC就会中止,JVM会进行Full GC来释放一些空间。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值