JVM--堆

45. JVM--堆

1. 堆的核心概述

一个进程对应一个JVM的实例,一个JVM实例中只有一个运行时数据区,里面只有一个方法区和堆,一个进程的多个线程共享方法区和堆,那就要考虑线程的安全问题。
每个线程各有一套程序计数器、本地方法栈、虚拟机栈。
  
1、一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。
2、Java堆区在JVM启动的时候即被创建,其空间大小也就确定了,堆是JVM管理的最大一块内存空间, 并且堆内存的大小是可以调节的。
3、《Java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的。
4、所有的线程共享Java堆,并发性就差,在这里还可以划分线程私有的缓冲区(Thread Local Allocation Buffer,TLAB),提高并发性。
5、《Java虚拟机规范》中对Java堆的描述是:所有的对象实例以及数组都应当在运行时分配在堆上。(The heap is the run-time data area from which memory for all class instances and arrays is allocated)
6、“几乎”所有的对象实例都在这里分配内存。因为还有一些对象是在栈上分配的
7、数组和对象可能永远不会存储在栈上,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置。
8、在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。也就是触发了GC的时候,才会进行回收。
如果栈里面对象引用一出栈,堆里面的对象立马GC,会造成GC的频率特别高,会影响用户线程的执行
9、堆,是GC(Garbage Collection,垃圾收集器)执行垃圾回收的重点区域。
虚拟机栈没有GC,只有入栈和出栈
对象实体所属的类是什么,定义的结构方法都在哪里?在方法区中。
 
一个JVM实例只存在一个堆内存,并且堆内存的大小是可以调节的
如何设置堆内存大小
-Xms10m -Xmx10m
Xms:堆区的起始内存
Xmx:堆区的最大内存
 
使用 JDK 自带的工具:Java VisualVM ,来查看堆内存
Java VisualVM 在 JDK 的 bin 目录下
堆空间设置的大小=新生代+老年代,不包括元空间。
  

● 堆内存分区:


2. 设置堆内存大小与 OOM

● 设置堆空间大小

1、Java堆区用于存储Java对象实例,那么堆的大小在JVM启动时就已经设定好了,大家可以通过选项"-Xms"和"-Xmx"来进行设置。
    -Xms用于表示堆区的起始内存,等价于-XX:InitialHeapSize
    -Xmx则用于表示堆区的最大内存,等价于-XX:MaxHeapSize
2、一旦堆区中的内存大小超过“-Xmx"所指定的最大内存时,将会抛出OutofMemoryError异常。
3、通常会将-Xms和-Xmx两个参数配置相同的值,其目的是为了能够在Java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。
4、默认情况下:
    初始内存大小:物理电脑内存大小/64
    最大内存大小:物理电脑内存大小/4
 
/**
 * 1. 设置堆空间大小的参数
 * -Xms 用来设置堆空间(年轻代+老年代)的初始内存大小
 *      -X 是jvm的运行参数
 *      ms 是memory start
 * -Xmx 用来设置堆空间(年轻代+老年代)的最大内存大小
 *
 * 2. 默认堆空间的大小
 *    初始内存大小:物理电脑内存大小 / 64
  *    最大内存大小:物理电脑内存大小 / 4
 * 3. 手动设置:-Xms600m -Xmx600m
 *     开发中建议将初始堆内存和最大的堆内存设置成相同的值。
        因为如果不一样,空间不够要扩容,空闲时候要释放,频繁的扩容和释放会造成系统的压力
  */ 
public  class  HeapSpaceInitial {
     public  static  void  main(String[] args) {
         //返回Java虚拟机中的堆内存总量
         long  initialMemory = Runtime.getRuntime().totalMemory() /  1024  1024 ;
         //返回Java虚拟机试图使用的最大堆内存量
         long  maxMemory = Runtime.getRuntime().maxMemory() /  1024  1024 ;
         System.out.println( "-Xms : "  + initialMemory +  "M" );
         System.out.println( "-Xmx : "  + maxMemory +  "M" );
         System.out.println( "系统内存大小为:"  + initialMemory *  64.0  1024  "G" );
         System.out.println( "系统内存大小为:"  + maxMemory *  4.0  1024  "G" );
     }
}
-Xms : 123M
-Xmx : 1801M
系统内存大小为:7.6875G
系统内存大小为:7.03515625G
 
● OOM 举例
/**
  * -Xms600m -Xmx600m
  */
public  class  OOMTest {
     public  static  void  main(String[] args) {
         ArrayList<Picture> list =  new  ArrayList<>();
         while ( true ){
             try  {
                 Thread.sleep( 20 );
             catch  (InterruptedException e) {
                 e.printStackTrace();
             }
             list.add( new  Picture( new  Random().nextInt( 1024  1024 )));
         }
     }
}
class  Picture{
     private  byte [] pixels;
     public  Picture( int  length) {
         this .pixels =  new  byte [length];
     }
}
监控堆内存变化:Old 区域一点一点在变大,直到最后一次垃圾回收器无法回收垃圾时,堆内存被撑爆,抛出 OutOfMemoryError 错误
 
堆内存变化图
 
分析原因:大对象导致堆内存溢出

3. 年轻代与老年代

● 存储在JVM中的Java对象可以被划分为两类:

1、一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
     1)生命周期短的,及时回收即可
     2)另外一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期保持一致
2、Java堆区进一步细分的话,可以划分为年轻代(YoungGen)和老年代(oldGen)
3、其中年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间(有时也叫做from区、to区,这两个区的大小是相等的)
对于生命周期比较短的,及时回收就可以了,对于生命周期比较长的,没必要每次GC的时候都判断要不要回收他,每次还不回收,就有点浪费, 那就可以放在不经常回收判断的位置就是老年代。
 
● 配置新生代与老年代的比例 (一般不会调)
1、默认-XX:NewRatio=2,表示新生代占1,老年代占2,新生代占整个堆的1/3
2、可以修改-XX:NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5
当发现在整个项目中,生命周期长的对象偏多,那么就可以通过调整老年代的大小,来进行调优
 
● 新生区中的比例
1、在HotSpot中,Eden空间和另外两个survivor空间缺省所占的比例是8 : 1 :1
   当然开发人员可以通过选项-XX:SurvivorRatio调整这个空间比例。比如-XX:SurvivorRatio=8
2、几乎所有的Java对象都是在Eden区被new出来的。绝大部分的Java对象的销毁都在新生代进行了(有些大的对象在Eden区无法存储时候,将直接进入老年代)
3、IBM公司的专门研究表明,新生代中80%的对象都是“朝生夕死”的。
4、新生区的对象默认生命周期超过 15 ,就会去养老区养老
 

4. 图解对象分配过程

 
1、我们创建的对象,一般都是存放在Eden区的,当我们Eden区满了后,就会触发GC操作,一般被称为 YGC / Minor GC操作。
Eden和S0、S1的比例是8:1:1,只有Eden满了才出发YGC,S0满了不会触发YGC,但是触发YGC时候会把Eden和S0一起回收。
2、当我们进行一次垃圾收集后, 红色的对象将会被回收(不再被使用,没有引用指向他),而绿色的还被使用着,存放在S0(Survivor From)区。
    同时我们给每个对象设置了一个年龄计数器, 经过一次回收后还存在的对象,将其年龄加 1。
3、同时Eden区继续存放对象,当Eden区再次存满的时候,又会触发一个MinorGC操作,此时GC将会把 Eden和Survivor From中的对象进行一次垃圾收集,
     把存活的对象放到 Survivor To区,同时让存活的对象年龄 + 1, 现在S1是From区,S0是To区(经过一次MinorGC后谁空谁就是To区)。
4、我们继续不断的进行对象生成和垃圾回收,当Survivor中的对象的年龄达到15的时候,将会触发一次 Promotion 晋升的操作,也就是将年轻代中的对象晋升到老年代中.
可以设置新生区进入养老区的年龄限制,设置 JVM 参数:-XX:MaxTenuringThreshold=N 进行设置
在养老区,相对悠闲。当养老区内存不足时,再次触发GC:Major GC,进行养老区的内存清理
若养老区执行了Major GC之后,发现依然无法进行对象的保存,就会产生OOM异常。
总结:
1、针对幸存者s0, s1区的总结:复制之后有交换,谁空谁是to.
2、关于垃圾回收:频繁在新生区收集,很少在养老区收集,几乎不在永久区/元空间收集
 
-Xms:初始堆空间内存 (默认为物理内存的1/64)
-Xmx:最大堆空间内存(默认为物理内存的1/4)
-XX:NewRatio:配置新生代与老年代在堆结构的占比
-XX:SurvivorRatio:设置新生代中Eden和S0/S1空间的比例
-XX:MaxTenuringThreshold:设置新生代垃圾的最大年龄
-XX:+PrintGCDetails:输出详细的GC处理日志
 

5. Minor GC、Major GC、Full GC

1、我们都知道,JVM的调优的一个环节,也就是垃圾收集,我们需要尽量的避免垃圾回收,因为在垃圾回收的过程中,容易出现STW(Stop the World)的问题,
     而 Major GC 和 Full GC出现STW的时间,是Minor GC的10倍以上
2、JVM在进行GC时,并非每次都对上面三个内存区域(新生代、老年代、方法区)一起回收的,大部分时候回收的都是指新生代。
     针对Hotspot VM的实现, 它里面的GC按照回收区域又分为两大种类型: 一种是部分收集(Partial GC),一种是整堆收集(FullGC)
 
● 部分收集:
不是完整收集整个Java堆的垃圾收集。其中又分为:
1、新生代收集(Minor GC/Young GC):只是新生代的垃圾收集
2、老年代收集:  (Major GC/Old GC):只是老年代的圾收集。
    注意,很多时候Major GC会和Full GC混淆使用,需要具体分辨是老年代回收还是整堆回收。
 
● 整堆收集(Full GC)
收集整个java堆和方法区的垃圾收集。
 
● 年轻代 GC(Minor GC)触发机制
1、当年轻代空间不足时,就会触发Minor GC,这里的年轻代满指的是Eden代满,Survivor满不会引发GC。(每次Minor GC会清理年轻代的内存)
2、因为Java对象大多都具备朝生夕灭的特性,所以Minor GC非常频繁,一般回收速度也比较快。这一定义既清晰又易于理解。
3、Minor GC会引发STW,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行,一般回收速度也比较快,所以对用户线程影响比较小,影响较大的是老年代GC,STW时间较长。
 
● 老年代 GC(MajorGC/Full GC)触发机制
1、指发生在老年代的GC,对象从老年代消失时,我们说 “Major Gc” 或 “Full GC” 发生了
2、出现了MajorGc,经常会伴随至少一次的Minor GC
      但非绝对的,在Parallel Scavenge收集器的收集策略里就有直接进行MajorGC的策略选择过程
      也就是在老年代空间不足时,会先尝试触发Minor GC,如果之后空间还不足,则触发Major GC
3、Major GC的速度一般会比Minor GC慢10倍以上,STW的时间更长,如果Major GC后,内存还不足,就报OOM了
 

6. 堆空间分代思想:

● 为什么要把Java堆分代?不分代就不能正常工作了吗?
经研究,不同对象的生命周期不同。70%-99%的对象是临时对象。
1、新生代:有Eden、两块大小相同的survivor(又称为from/to,s0/s1)构成,to总为空。
2、老年代:存放新生代中经历多次GC仍然存活的对象。长期存活的对象分配到老年代
 
其实不分代完全可以, 分代的唯一理由就是优化GC性能
1、如果没有分代,那所有的对象都在一块,就如同把一个学校的人都关在一个教室。GC的时候要找到哪些对象没用,这样就会对堆的所有区域进行扫描。
2、而很多对象都是朝生夕死的,如果分代的话,把新创建的对象放到某一地方,当GC的时候先把这块存储“朝生夕死”对象的区域进行回收,这样就会腾出很大的空间出来。
 
Minor GC会引发STW,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行,一般回收速度也比较快,所以对用户线程影响比较小,
 影响较大的是老年代GC,STW时间较长,对GC的优化减少GC出现的频率
  
就像疫情的核酸检测,将城阳区人群分为:1、本地没出去的人 2、疫区回来的人 3、得过新冠的人,如果都每隔两天进行全员核酸检测代价太大,对本地可以十天一次核酸检测,疫区回来的一周一次,得过的三天一次。
 

7. TLAB:Thread Local Allocation Buffer

●  问题:堆空间都是共享的么?
不一定,因为还有TLAB这个概念,在堆中划分出一块区域,为每个线程所独占
 
● 为什么有TLAB(Thread Local Allocation Buffer)?
1、TLAB:Thread Local Allocation Buffer,也就是为每个线程单独分配了一个缓冲区
2、堆区是线程共享区域,任何线程都可以访问到堆区中的共享数据
3、由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的,
      为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。
 
● 什么是 TLAB?
1、从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分, JVM为每个线程分配了一个私有缓存区域,它包含在Eden空间内。
2、多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略。
1、尽管不是所有的对象实例都能够在TLAB中成功分配内存,但JVM确实是将TLAB作为内存分配的首选。
2、默认情况下,TLAB空间的内存非常小,仅占有整个Eden空间的1%
3、一旦对象在TLAB空间分配内存失败时,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存。

● 堆小结:

1、老年代放置长生命周期的对象,通常都是从Survivor区域筛选拷贝过来的Java对象。
2、JVM为每个线程分配了一个私有缓存区域TLAB,将TLAB作为内存分配的首选
      如果对象较大,无法分配在 TLAB 上,则JVM会试图直接分配在Eden其他位置上;
     如果对象太大,完全无法在新生代找到足够长的连续空闲空间,JVM就会直接分配到老年代。
3、当GC只发生在年轻代中,回收年轻代对象的行为被称为Minor GC。 当GC发生在老年代时则被称为Major GC或者Full GC。
     一般的,Minor GC的发生频率要比Major GC高很多,即老年代中垃圾回收发生的频率将大大低于年轻代。
  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值