面试总结:JVM (深入理解JVM结构、类加载机制、垃圾回收GC原理、JVM内存分配策略、JVM内存泄露和溢出)

JVM面试总结:

在这里插入图片描述

1.JVM结构

JVM的内部结构:
JVM内部结构
各部分的主要功能:

  • 类加载器
    JVM启动,程序开始执行时,负责将class字节码加载到JVM内存区域中

  • 执行引擎
    负责执行class文件中包含的字节码指令

  • 本地方法库
    主要是调用C或C++实现的本地方法及返回结果

  • 运行时数据区【重点关注***】

    • 方法区(Method Area)
      用于存储类结构信息的地方,包括常量池、静态变量、构造函数等。

    • java堆(Heap)
      存储java实例或者对象的地方。这块是GC的主要区域。方法区和堆是被所有java线程共享的

    • java栈(Stack)
      java栈总是和线程关联在一起,每当创建一个线程时,JVM就会为这个线程创建一个对应的java栈。在这个java栈中又会包含多个栈帧,每运行一个方法就创建一个栈帧,用于存储局部变量表、操作栈、方法返回值等。每一个方法从调用直至执行完成的过程,就对应一个栈帧在java栈中入栈到出栈的过程。所以java栈是现成私有的。

    • 程序计数器(PC Register)
      程序计数器是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

    • 本地方法栈(Native Method Stack)
      和java栈的作用差不多,只不过是为JVM使用到的native方法服务的。


2. 类加载机制

类加载过程
在这里插入图片描述
1、加载
将class字节码文件加载到内存中,并将这些数据转换成方法区中的运行时数据(静态变量、静态代码块、常量池等),在堆中生成一个Class类对象代表这个类(反射原理),作为方法区类数据的访问入口。

2、链接
将Java类的二进制代码合并到JVM的运行状态之中。

  • 验证
    确保加载的类信息符合JVM规范,没有安全方面的问题。
  • 准备
    正式为类变量(static变量)分配内存并设置类变量初始值的阶段,这些内存都将在方法区中进行分配。注意此时的设置初始值为默认值,具体赋值在初始化阶段完成。
  • 解析
    虚拟机常量池内的符号引用替换为直接引用(地址引用)的过程。

3、初始化
初始化阶段是执行类构造器()方法的过程。类构造器()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static块)中的语句合并产生的。

当初始化一个类的时候,如果发现其父类还没有进行过初始化、则需要先初始化其父类。
虚拟机会保证一个类的()方法在多线程环境中被正确加锁和同步。

在这里插入图片描述

  • 启动类加载器 Bootsrap ClassLoader
    它是最顶层的类加载器,是由C++编写而成, 已经内嵌到JVM中了。在JVM启动时会初始化该ClassLoader,它主要用来读取Java的核心类库JRE/lib/rt.jar中所有的class文件,
    如果需要将自己写的类加载器加载请求委派给引导类加载器,那直接使用null代替即可。
  • 扩展类加载器 Extension ClassLoader
    负责加载\lib\ext目中的jar包。
    java编写,加载扩展库,如classpath中的jre ,javax.*或 java.ext.dir 指定位置中的类,开发者可以直接使用标准扩展类加载器。
  • 应用程序类加载器 Application ClassLoader
    是类加载器ClassLoader.getSystemClassLoader()方法的返回值,因此称为系统类加载器,负责加载用户路径上指定的类库。一般情况下是默认的类加载器。
  • 自定义类加载器 Custom ClassLoader
    负责加载用户自定义的jar包

双亲委派机制及作用

什么是双亲委派机制?
当某个类加载器需要加载某个.class文件时,它首先把这个任务委托给他的上级类加载器,递归这个操作,如果上级的类加载器没有加载,自己才会去加载这个类。
在这里插入图片描述
双亲委派机制的作用

  • 1、防止重复加载同一个.class。通过委托去向上面问一问,加载过了,就不用再加载一遍。保证数据安全。
  • 2、保证核心.class不能被篡改。通过委托方式,不会去篡改核心.clas,即使篡改也不会去加载,即使加载也不会是同一个.class对象了。不同的加载器加载同一个.class也不是同一个Class对象。这样保证了Class执行安全。

3.JVM垃圾回收GC原理

垃圾回收算法主要采用的是 分代收集算法【GC】
GC是根据对象的存活周期的不同将内存划分为几块。一般是把java堆分成新生代老年代。新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要复制少量存活对象即可完成收集。而老年代中因为对象存活率高、没有额外的空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法来回收。
在这里插入图片描述
总体来说:

次数上频繁收集Young区
次数上较少收集Old区
基本不动Perm区

1.GC的主要几种算法及分布

1.引用计数法:简单来说当这个引用计数为0时 清理

在这里插入图片描述
不过这种算法也存在缺陷:循环引用,比如你引用我,我引用你;这样的话两个都计数都不可能为0,都会成为常驻内存,引起堆爆

2:复制算法(Copying)(新生区的算法)

年轻代中使用的是Minor GC,这种GC算法采用的是复制算法(Copying);

  • 原理:
    Minor GC会把Eden中的所有活的对象都移到Survivor区域中,如果Survivor区中放不下,那么剩下的活的对象就被移到Old generation中,也即一旦收集后,Eden是就变成空的了。
    当对象在 Eden ( 包括一个 Survivor 区域,这里假设是 from 区域 ) 出生后,在经过一次 Minor GC 后,如果对象还存活,并且能够被另外一块 Survivor 区域所容纳( 上面已经假设为 from 区域,这里应为 to 区域,即 to 区域有足够的内存空间来存储 Eden 和 from 区域中存活的对象 ),则使用复制算法将这些仍然还存活的对象复制到另外一块 Survivor 区域 ( 即 to 区域 ) 中,然后清理所使用过的 Eden 以及 Survivor 区域 ( 即 from 区域 ),并且将这些对象的年龄设置为1,以后对象在 Survivor 区每熬过一次 Minor GC,就将对象的年龄 + 1,当对象的年龄达到某个值时 ( 默认是 15 岁,通过-XX:MaxTenuringThreshold 来设定参数),这些对象就会成为老年代。
    -XX:MaxTenuringThreshold — 设置对象在新生代中存活的次数;(调高内存缓解养老区的溢出)
    简单来说就是将幸存者从a复制到b,在这里插入图片描述

这种算法如图中所描述:
优点是:
效率高,只用扫描
复制过去都是挨在一块,没有内存碎片
缺点是:
需要双倍空间,浪费了一半的内存;
不过新生区存活率比较低,切新生区内存也比较小

3:标记清除(Mark-Sweep)(养老区)

老年代一般是由标记清除或者是标记清除与标记整理的混合实现
在这里插入图片描述
可以看出:这种算法需要扫描两遍,与上面的复制算法相比多扫描了一遍
与上面的复制算法相比

优点:
不浪费内存
缺点:
多扫描了一次,效率没复制算法高
清除完会产生内存谁骗

注意:在进行标记清除算法的时候,功能会暂停,
总结:此算法需要暂停整个应用,会产生内存碎片,效率低

4:标记压缩(Mark-Compact)(养老区)

老年代一般是由标记清除或者是标记清除与标记整理的混合实现

原理:
在这里插入图片描述

标记的存活对象将会被整理,按照内存地址依次排列,而未被标记的内存会被清理掉;
如此一来,当我们需要给新对象分配内存时,JVM只需要持有一个内存的起始地址即可,这比维护一个空闲列表显然少了许多开销。

优点:
可以看出这个算法弥补标记/清除算法当中,内存区域分散的缺点,也消除了复制算法当中,内存减半的高额代价;不过移动对象也有缺点:耗费系统资源,也会耗费时间;
缺点:
标记/整理算法唯一的缺点就是效率也不高,不仅要标记所有存活对象,还要整理所有存活对象的引用地址。从效率上来说,标记/整理算法要低于复制算法。

5:标记清除压缩(Mark-Sweep-Compact)

简单来说就是上面两种的结合
首先先进行标记清除;但凡碎片多了在进行一次标记压缩
这样就结合了两个的优点,同时减少移动对象的成本


4.JVM内存分配及回收策略

新生代和老年代的说,JVM的内存分配也是和GC保持一致的
内存分配如图:
在这里插入图片描述

具体的回收策略如图:
回收策略

总结策略就是:

1.对象优先在Eden分配
2.大对象直接进老年代
3.长期存活的对象将进入老年代
4.动态对象进行年龄判定再分代


5.JVM内存泄露和溢出

1.定义

内存泄露

  • 指程序中动态分配内存给一些临时对象,但是对象不会被GC所回收,它始终占用内存。即被分配的对象可达但已无用。

内存溢出

  • 指程序运行过程中无法申请到足够的内存而导致的一种错误。内存溢出通常发生于OLD段或Perm段垃圾回收后,仍然无内存空间容纳新的Java对象的情况。

从定义上可以看出内存泄露是内存溢出的一种诱因不是唯一因素

Java 堆内存的OutOfMemoryError异常是实际应用中最常见的内存溢出异常情况。出现Java
堆内存溢出时,异常堆栈信息“java.lang.OutOfMemoryError”会跟着进一步提示“Java heapspace”。

2.常见内存泄露的几种场景

  • 1、长生命周期的对象持有短生命周期对象的引用

这是内存泄露最常见的场景,也是代码设计中经常出现的问题。例如:在全局静态map中缓存局部变量,且没有清空操作,随着时间的推移,这个map会越来越大,造成内存泄露。

  • 2、修改hashset中对象的参数值,且参数是计算哈希值的字段
    当一个对象被存储进HashSet集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段,否则对象修改后的哈希值与最初存储进HashSet集合中时的哈希值就不同了,在这种情况下,即使在contains方法使用该对象的当前引用作为参数去HashSet集合中检索对象,也将返回找不到对象的结果,这也会导致无法从HashSet集合中删除当前对象,造成内存泄露。

  • 3、机器的连接数和关闭时间设置
    长时间开启非常耗费资源的连接,也会造成内存泄露。

3.内存溢出的几种情况

  • 1、堆内存溢出(outOfMemoryError:Java heap space)
    在jvm规范中,堆中的内存是用来生成对象实例和数组的。
    如果细分,堆内存还可以分为年轻代和年老代,年轻代包括一个eden区两个survivor区
    当生成新对象时,内存的申请过程如下:
  • a、jvm先尝试在eden区分配新建对象所需的内存;
  • b、如果内存大小足够,申请结束,否则下一步;
  • c、jvm启动youngGC,试图将eden区中不活跃的对象释放掉,释放后若Eden空间仍然不足以放入新对象,则试图将部分Eden中活跃对象放入Survivor区;
  • d、Survivor区被用来作为Eden及old的中间交换区域,当OLD区空间足够时,Survivor区的对象会被移到Old区,否则会被保留在Survivor区;
  • e、 当OLD区空间不够时,JVM会在OLD区进行full GC;
  • f、fullGC后,若Survivor及OLD区仍然无法存放从Eden复制过来的部分对象,导致JVM无法在Eden区为新对象创建内存区域,

则出现”out of memory错误”: outOfMemoryError:java heap space

  • 2、方法区内存溢出(outOfMemoryError:permgem space)
    在jvm规范中,方法区主要存放的是类信息、常量、静态变量等。
    所以如果程序加载的类过多,或者使用反射、gclib等这种动态代理生成类的技术,就可能导致该区发生内存溢出,
    一般该区发生内存溢出时的错误信息为: outOfMemoryError:permgem space
  • 3、线程栈溢出(java.lang.StackOverflowError)
    线程栈时线程独有的一块内存结构,所以线程栈发生问题必定是某个线程运行时产生的错误。一般线程栈溢出是由于递归太深或方法调用层级过多导致的。
    发生栈溢出的错误信息为:java.lang.StackOverflowError

4.发生了内存泄露或溢出怎么办?

要解决这个区域的异常,一般的手段是首先通过内存映像分析工具(如Eclipse Memory Analyzer)对dump 出来的堆转储快照进行分析,重点是确认内存中的对象是否是必要的,也就是要先分清楚到底是出现了内存泄漏(Memory Leak)还是内存溢出(Memory Overflow)。

如果是内存泄漏,可进一步通过工具查看泄漏对象到GC Roots 的引用链。于是就能找到泄漏对象是通过怎样的路径与GC Roots 相关联并导致垃圾收集器无法自动回收它们的。掌握了泄漏对象的类型信息,以及GC Roots 引用链的信息,就可以比较准确地定位出泄漏代码的位置。

如果不存在泄漏,换句话说就是内存中的对象确实都还必须存活着,那就应当检查虚拟机的堆参数(-Xmx 与-Xms),与机器物理内存对比看是否还可以调大,从代码上检查是否存在某些对象生命周期过长、持有状态时间过长的情况,尝试减少程序运行期的内存消耗。

5.怎么样避免发生内存泄露和溢出

  • 1、尽早释放无用对象的引用

  • 2、使用字符串处理,避免使用String,应大量使用StringBuffer,每一个String对象都得独立占用内存一块区域

  • 3、尽量少用静态变量,因为静态变量存放在永久代(方法区),永久代基本不参与垃圾回收

  • 4、避免在循环中创建对象

  • 5、开启大型文件或从数据库一次拿了太多的数据很容易造成内存溢出,所以在这些地方要大概计算一下数据量的最大值是多少,并且设定所需最小及最大的内存空间值。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值