Java程序运行与JVM

JVM

一个Java程序的运行过程:

编译:由Java源代码(.java文件)到字节码(.class文件)文件,例如:javac HelloWorld.java

链接:在运行时将所需的类和库结合在一起。在Java中,链接的概念和C/C++中的静态链接和动态链接不同。Java的链接过程是指在运行时将各个类和库结合在一起的过程。链接主要发生在类加载期间,JVM会查找和验证所需的类和库。

加载:加载是将编译后的字节码(.class文件)读入JVM的过程。JVM使用类加载器(ClassLoader)来完成这一过程。

类加载器

Java中类加载器的层次结构是一个典型的双亲委派模型(Parent Delegation Model)。主要分为以下几种:

  1. Bootstrap ClassLoader(启动类加载器):是由JVM自带的,用来加载JVM核心类库(如rt.jar)。它不是一个Java类,而是用本地代码实现的。
  2. Extension ClassLoader(扩展类加载器):用来加载Java的扩展库,通常是jre/lib/ext目录下的类库。这个类加载器是sun.misc.Launcher$ExtClassLoader的实例。
  3. Application ClassLoader(应用程序加载器):也叫应用类加载器,加载应用程序的类路径(classpath)上的类。这个类加载器是sun.misc.Launcher$AppClassLoader的实例。

类加载器如何加载类

类加载器加载类的过程可以分为以下几个步骤:

  1. 检查缓存:类加载器会先检查缓存,看看类是否已经被加载过,如果是,直接返回Class对象。
  2. 双亲委派:如果缓存中没有找到该类,类加载器会将类加载请求委派给父加载器,直到最顶层的Bootstrap ClassLoader。
  3. 加载类:如果父加载器无法完成加载请求,当前类加载器会自己尝试加载该类。这个过程通常包括:
    • 查找类文件:在类路径或指定的目录中查找对应的.class文件。
    • 读取类文件:将.class文件的内容读入内存。
    • 解析和定义类:将字节码解析为Class对象。

Java中分不同类型的类加载器是为了实现安全、模块化、隔离性和灵活性的类加载机制。例如用户自己也创建了一个String类 包名都和jdk自带的相同 ,那么在加载的时候还是优先用启动类加载器,加载了就返回,保证了核心String类不受影响

自定义类加载器

可以通过继承ClassLoader类来创建自定义的类加载器。下面是一个简单的示例:

import java.io.ByteArrayOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;

public class MyClassLoader extends ClassLoader {
    private String classPath;

    public MyClassLoader(String classPath) {
        this.classPath = classPath;
    }

    @Override
    protected Class<?> findClass(String name) throws ClassNotFoundException {
        byte[] data = loadClassData(name);
        if (data == null) {
            throw new ClassNotFoundException();
        }
        return defineClass(name, data, 0, data.length);
    }

    private byte[] loadClassData(String className) throws IOException {
        className = className.replace(".", "/");
        InputStream is = new FileInputStream(classPath + "/" + className + ".class");
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        int b;
        while ((b = is.read()) != -1) {
            baos.write(b);
        }
        return baos.toByteArray();
    }

    public static void main(String[] args) {
        try {
            MyClassLoader classLoader = new MyClassLoader("/path/to/classes");
            Class<?> clazz = classLoader.loadClass("com.example.MyClass");
            Object instance = clazz.newInstance();
            System.out.println(instance.getClass().getName());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在这个示例中,自定义类加载器MyClassLoader会从指定的路径中加载类文件,并将其转换为Class对象。通过覆盖findClass方法来实现类加载的逻辑。

JVM内存模型

image-20240711171545765

方法区

存储类结构信息,如运行时常量池、字段和方法数据、构造函数和普通方法的字节码内容

永久代(Permanent Generation, PermGen)

  • 早期的HotSpot JVM使用永久代来实现方法区。永久代是固定大小的内存区域,用于存储类的元数据。
  • 缺点:由于永久代有固定大小,可能会导致OutOfMemoryError: PermGen space错误,特别是在动态生成大量类的应用中(如大量JSP或OSGi的场景)。

元空间(Metaspace)

  • 在Java 8及以后,HotSpot JVM使用元空间来替代永久代。元空间从本地内存中分配,而不是从JVM堆中分配。
  • 优点:由于元空间使用本地内存,大小受限于可用的系统内存,可以动态调整,减少了内存溢出的风险。
方法区的特点
  • 线程共享:方法区是所有线程共享的内存区域,不同线程之间可以访问相同的类信息。
  • 生命周期:方法区中的信息随着类加载和卸载而变化。当一个类被加载时,其相关信息被放入方法区;当类被卸载时,其相关信息被移出方法区。
  • 垃圾收集:方法区的垃圾收集主要是对常量池和类型的卸载,但方法区的回收效率通常较低,回收频率也较低。

分配过程

image-20240711171306328

实际上对象在分配的时候会进行逃逸分析,如果逃逸分析确定某个对象不会逃逸出当前方法(即方法级别逃逸),JVM可以将该对象分配在栈上而不是堆上。

public void foo() {
    Point p = new Point(1, 2);
    // 使用p
}

//分配到堆上,因为p的作用域范围不确定
public Point foo() {
    Point p = new Point(1, 2);
    return p;
}

JDK7之后默认开启逃逸分析

分代收集理论

image-20240711171601061

ps:大对象直接移植到老年代,小对象经过以下过程

  1. 创建对象:
    • 伊甸区 (Eden Space)
  2. Minor GC(新生代垃圾回收):
    • 存活对象移动到幸存者区 (Survivor Space S0)
  3. 幸存者区存活对象:
    • 在S0和S1之间复制和轮换,年龄增加(通常是15次)
  4. 晋升到老年代:
    • 达到年龄阈值或幸存者区过满
  5. Major GC/Full GC(老年代垃圾回收):
    • 清理老年代的不可达对象
垃圾回收算法与垃圾收集器
垃圾回收算法

1.标记复制算法

将内存分为大小相同的两块,每次使用其中一块,当这一块内存使用完后,就将还存活的对象复制到另一块去,然后把使用的空间一次性清理掉。(效率高 但是造成内存浪费)用于年轻代

image-20240711171326404

2.标记清除算法

分为标记和清除两个阶段,第一阶段标记处所要回收的对象,第二阶段将标记的回收对象统一回收(简单但效率低产生大量不连续的碎片

image-20240711171342596

3.标记整理算法

标记过程与标记清除算法一样,但是后续让所有可回收对象向一端移动。一般用于老年代

image-20240711171359348

垃圾回收器

Java虚拟机(JVM)提供了多种垃圾回收器,每种垃圾回收器都有其特定的特点和适用场景。选择合适的垃圾回收器可以显著提高应用程序的性能和响应速度。以下是JVM中的主要垃圾回收器及其特点:

  1. Serial Garbage Collector (Serial GC)
  • 选项-XX:+UseSerialGC
  • 特点:使用单线程进行垃圾收集,适用于单核处理器或较小的内存环境。
  • 优点:实现简单,适合单线程应用。
  • 缺点:GC暂停时间较长,不适合多线程或高并发应用。

image-20240711171413655

  1. Parallel Garbage Collector (Parallel GC)
  • 选项-XX:+UseParallelGC
  • 特点:使用多线程进行垃圾收集,旨在最大化吞吐量,适合多核处理器。
  • 优点:在多核处理器上性能良好,适合批处理应用。
  • 缺点:GC暂停时间较长,不适合对延迟敏感的应用。
  1. Parallel Old Garbage Collector
  • 选项-XX:+UseParallelOldGC
  • 特点:Parallel GC的改进版,增加了对老年代的多线程收集。
  • 优点:更高的吞吐量,适合大多数服务器端应用。
  • 缺点:同样存在GC暂停时间较长的问题。

image-20240711171444663

  1. Concurrent Mark-Sweep (CMS) Garbage Collector
  • 选项-XX:+UseConcMarkSweepGC
  • 特点:并发进行垃圾收集,减少长时间的GC暂停。
  • 优点:低延迟,适合对响应时间要求高的应用,如Web服务器。
  • 缺点:相比其他收集器,CMS会消耗更多的CPU资源。CMS收集器可能会出现“浮动垃圾”问题,即在并发清理阶段新产生的垃圾。

image-20240711171457206

  1. Garbage-First (G1) Garbage Collector
  • 选项-XX:+UseG1GC
  • 特点:旨在取代CMS GC,适合大内存和多核处理器环境。将堆划分为多个区域,优先收集垃圾最多的区域。
  • 优点:更好的暂停时间控制,适合大堆内存,低延迟。
  • 缺点:复杂性较高,需要进行一定的调优。
  1. Z Garbage Collector (ZGC)
  • 选项-XX:+UseZGC
  • 特点:超低暂停时间的垃圾收集器,目标是GC暂停时间不超过10ms。
  • 优点:非常低的暂停时间,适合对延迟极其敏感的应用。
  • 缺点:目前只支持64位系统(Linux,Windows和macOS),适合内存非常大的应用(上百GB)。
  1. Shenandoah Garbage Collector
  • 选项-XX:+UseShenandoahGC
  • 特点:和ZGC类似,目标是低暂停时间。通过并发方式减少GC暂停时间。
  • 优点:低暂停时间,适合大堆内存的应用。
  • 缺点:消耗更多的CPU资源,主要在OpenJDK中提供。
  1. Epsilon Garbage Collector
  • 选项-XX:+UseEpsilonGC
  • 特点:所谓“无操作”垃圾收集器,不进行任何垃圾收集操作。
  • 优点:用于性能测试和内存管理研究。
  • 缺点:没有实际的垃圾收集功能,内存用完时应用会崩溃。

image-20240711171513221

DK 1.8默认使用 Parallel(年轻代和老年代都是)
JDK 1.9默认使用 G1

三色标记算法

在并发标记的过程中,因为标记期间应用线程还在继续跑,对象间的引用可能发生变化,多标和漏标的情况就有可能发生。漏标的问
题主要引入了三色标记算法来解决。

三色标记算法将堆中的对象分为三类:

  1. 白色(White):尚未被访问的对象。垃圾收集过程结束时,所有白色对象都被认为是不可达的,可以被回收。
  2. 灰色(Gray):已被访问但其引用的对象尚未全部处理完的对象。垃圾收集器需要进一步扫描这些对象。
  3. 黑色(Black):已被访问且其引用的对象已全部处理完的对象。黑色对象不会再次被扫描。
步骤
  1. 初始化:开始时,所有对象都标记为白色。根集合(Root Set,如栈上的引用、全局变量等)中的对象被标记为灰色,并放入一个工作队列中。
  2. 标记阶段
    • 从工作队列中取出一个灰色对象,将其标记为黑色。
    • 遍历这个灰色对象引用的所有对象。如果被引用的对象是白色,则将其标记为灰色,并将其加入工作队列。
    • 重复这一过程,直到工作队列为空。
  3. 清理阶段:标记阶段结束后,所有白色对象都是不可达的,垃圾收集器可以回收这些对象。
并发标记和三色不变式

在并发垃圾收集器(如CMS GC和G1 GC)中,应用线程和垃圾收集线程是并发运行的。为了确保垃圾收集器在并发环境下的正确性,三色标记算法引入了三色不变式:

  1. 强三色不变式:黑色对象不能直接引用白色对象。也就是说,任何黑色对象的引用对象都必须是灰色或黑色。
  2. 弱三色不变式:灰色对象不能直接引用白色对象。也就是说,任何灰色对象的引用对象都必须是灰色或黑色。

为了解决并发环境下违反三色不变式的问题,垃圾收集器可以使用“插入屏障”(Insertion Barrier)和“删除屏障”(Deletion Barrier):

  • 插入屏障:在应用线程将一个新的引用指向一个白色对象时,将这个白色对象标记为灰色。
  • 删除屏障:在应用线程删除一个引用时,确保这个引用对象要么是灰色,要么是黑色,以维护三色不变式。

----------------------------------------------------------------------------TODO 对于G1 ZGC 三色标记法 性能调优 以后有空再做详细整理-----------------------------------------------------------------

  • 插入屏障:在应用线程将一个新的引用指向一个白色对象时,将这个白色对象标记为灰色。
  • 删除屏障:在应用线程删除一个引用时,确保这个引用对象要么是灰色,要么是黑色,以维护三色不变式。

----------------------------------------------------------------------------TODO 对于G1 ZGC 三色标记法 性能调优 以后有空再做详细整理-----------------------------------------------------------------

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值