Java 8到Java 24：核心特性介绍-CSDN博客

版本	发布日期	LTS	核心技术突破
Java 8	2014年3月	✓	Lambda表达式、Stream API、函数式接口
Java 11	2018年9月	✓	HTTP客户端API、var类型推断、G1成为默认GC
Java 17	2021年9月	✓	密封类、Record类、模式匹配、ZGC改进
Java 21	2023年9月	✓	虚拟线程、记录模式、序列化集合、分代ZGC
Java 24	2025年3月	✗	流收集器、原生类型模式匹配、灵活构造器体

二、代码层面特性与实现原理

1. Lambda表达式与函数式接口（Java 8）

Lambda表达式彻底改变了Java编程范式，使函数式编程风格成为可能。它的本质是一个匿名函数，依赖于函数式接口（只有一个抽象方法的接口）实现。

java

// 函数式接口定义
@FunctionalInterface
interface Calculator {
    int calculate(int a, int b);
}

// Lambda表达式使用
Calculator addition = (a, b) -> a + b;
Calculator subtraction = (a, b) -> a - b;
System.out.println(addition.calculate(5, 3));     // 输出: 8
System.out.println(subtraction.calculate(5, 3));  // 输出: 2

// 方法引用
List<String> names = Arrays.asList("张三", "李四", "王五");
names.forEach(System.out::println);

实现原理：Java编译器通过invokedynamic指令和LambdaMetafactory实现Lambda表达式。当第一次调用Lambda表达式时，JVM会动态生成一个实现函数式接口的类，并创建该类的实例。这种延迟实现机制避免了为每个Lambda表达式生成单独的类文件，提高了性能。

Lambda表达式的变量捕获必须是final或effectively final（虽未声明为final但值不变），这是为了确保并发安全和函数式编程的不变性原则。如果允许修改捕获的变量，可能导致并发问题，同时违背了函数式编程的无副作用原则。

与匿名内部类相比，Lambda表达式有几个重要区别：

Lambda没有自己的this引用，它的this指向外部类
Lambda更轻量，不会为每个表达式生成新的类文件
Lambda表达式只能访问final或effectively final变量
Lambda表达式使用invokedynamic实现，而匿名内部类直接生成类文件

2. Stream API与并行处理（Java 8）

Stream API基于内部迭代模式，将集合处理操作分为中间操作（懒加载）和终端操作（触发执行）。并行流利用Fork/Join框架实现并行处理。

java

// 串行流处理
long count = list.stream()
    .filter(s -> s.startsWith("A"))
    .map(String::toUpperCase)
    .count();

// 并行流处理
long count = list.parallelStream()
    .filter(s -> s.startsWith("A"))
    .map(String::toUpperCase)
    .count();

// 复杂数据处理示例
List<Employee> employees = getEmployees();
Map<Department, Double> avgSalaryByDept = employees.stream()
    .collect(Collectors.groupingBy(
        Employee::getDepartment,
        Collectors.averagingDouble(Employee::getSalary)
    ));

实现原理：Stream操作通过Spliterator接口实现数据分割，结合Fork/Join框架的工作窃取算法实现高效并行处理。中间操作会构建一个操作链，只有在终端操作调用时才会执行。

Stream API的惰性求值是通过操作链和终端操作实现的。中间操作（如filter、map）只是构建操作链，不会立即执行，而是返回一个新的Stream。只有当终端操作（如collect、forEach）被调用时，才会触发整个操作链的执行。这种设计允许Stream API进行各种优化，如操作融合、短路和并行处理。

并行流并非适用于所有场景，不适合使用的情况包括：

数据量小，并行开销超过收益
操作涉及共享状态或副作用
操作顺序敏感
使用的Spliterator分割效率低
系统CPU核心数有限
操作是IO密集型而非CPU密集型

3. 虚拟线程（Java 21）

虚拟线程是Java 21引入的轻量级线程实现，它们不是直接映射到操作系统线程，而是由JVM管理并调度到有限数量的平台线程（操作系统线程）上。这使得应用可以创建数百万个虚拟线程，而不会耗尽系统资源。

java

// 创建和启动单个虚拟线程
Thread vThread = Thread.startVirtualThread(() -> {
    System.out.println("Running in virtual thread: " + Thread.currentThread());
    try {
        // 模拟IO操作
        Thread.sleep(100);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
});
vThread.join();

// 使用虚拟线程执行器处理大量任务
try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
    // 提交100,000个任务
    List<Future<String>> futures = new ArrayList<>();
    for (int i = 0; i < 100_000; i++) {
        final int id = i;
        futures.add(executor.submit(() -> {
            // 模拟网络请求
            Thread.sleep(new Random().nextInt(100));
            return "Result from task " + id;
        }));
    }
    
    // 获取结果
    for (Future<String> future : futures) {
        System.out.println(future.get());
    }
}

// 实际应用示例：并发HTTP请求
HttpClient client = HttpClient.newHttpClient();
List<URI> uris = List.of(
    new URI("https://api.example.com/users" ),
    new URI("https://api.example.com/products" ),
    new URI("https://api.example.com/orders" )
);

try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
    List<Future<String>> responses = uris.stream()
        .map(uri -> executor.submit(() -> {
            HttpRequest request = HttpRequest.newBuilder(uri).build();
            return client.send(request, HttpResponse.BodyHandlers.ofString()).body();
        }))
        .collect(Collectors.toList());
    
    for (Future<String> response : responses) {
        System.out.println(response.get());
    }
}

调度机制：

挂起与恢复：当虚拟线程执行阻塞操作（如I/O或sleep）时，JVM会自动将其挂起，释放底层平台线程去执行其他虚拟线程。当阻塞操作完成时，虚拟线程会被恢复并重新调度。
协作式调度：虚拟线程使用协作式调度而非抢占式调度。它们只在特定的挂起点（如阻塞I/O、sleep、park等）才会让出底层平台线程。
线程池复用：JVM维护一个平台线程池（ForkJoinPool），所有虚拟线程共享这些平台线程。默认情况下，池大小等于可用处理器数量。
连续性保证：虚拟线程恢复执行时，不一定在同一个平台线程上继续，但JVM确保其执行上下文（如局部变量、栈帧）正确恢复。

内存模型：每个虚拟线程只需要几百字节的内存（相比平台线程的几MB），主要用于存储线程状态和执行上下文。虚拟线程的栈不是预分配的，而是按需增长，这大大减少了内存占用。

虚拟线程与平台线程的主要区别包括：

内存占用：虚拟线程只需几百字节，而平台线程需要几MB
调度方式：虚拟线程使用协作式调度，平台线程使用操作系统的抢占式调度
数量限制：可以创建数百万虚拟线程，而平台线程通常受系统资源限制
阻塞行为：虚拟线程阻塞时不会阻塞底层平台线程
栈管理：虚拟线程使用堆内存动态管理栈，而平台线程有固定大小的栈

虚拟线程在以下场景特别有优势：

I/O密集型应用，如Web服务器、数据库连接池
需要处理大量并发连接的系统
执行大量独立且可能阻塞的任务
微服务架构中的服务间通信
需要简化异步编程模型的场景

使用虚拟线程需注意：

不适合CPU密集型任务，这种情况下传统线程池可能更高效
线程局部变量(ThreadLocal)使用需谨慎，可能导致内存泄漏
同步块中的阻塞操作会导致"钉住"底层平台线程
不支持线程优先级和线程组
某些监控和分析工具可能需要更新才能正确处理虚拟线程

4. 记录类（Record）与模式匹配（Java 16-21）

Record是一种特殊的类，专为不可变数据设计，自动生成构造器、访问器、equals、hashCode和toString。模式匹配扩展了instanceof和switch，允许在类型检查的同时进行变量绑定和解构。

java

// Record定义
record Point(int x, int y) {
    // 可以添加静态方法、实例方法和紧凑构造器
    public Point {
        if (x < 0 || y < 0) {
            throw new IllegalArgumentException("Coordinates cannot be negative");
        }
    }
    
    public double distanceFromOrigin() {
        return Math.sqrt(x * x + y * y);
    }
}

// 嵌套Record
record Rectangle(Point topLeft, Point bottomRight) {
    public int width() {
        return bottomRight.x() - topLeft.x();
    }
    
    public int height() {
        return bottomRight.y() - topLeft.y();
    }
}

// 模式匹配与Record结合
Object obj = new Rectangle(new Point(1, 2), new Point(5, 6));

// instanceof模式匹配
if (obj instanceof Rectangle r) {
    System.out.println("Width: " + r.width());
}

// switch模式匹配（Java 21）
String description = switch (obj) {
    case Rectangle(Point(var x1, var y1), Point(var x2, var y2)) ->
        "Rectangle from (" + x1 + "," + y1 + ") to (" + x2 + "," + y2 + ")";
    case Point(var x, var y) ->
        "Point at (" + x + "," + y + ")";
    default ->
        "Unknown shape";
};

实现原理：

Record类在编译时生成final类，所有字段都是private final，并自动生成公共访问器方法。
模式匹配在编译时转换为一系列类型检查和强制类型转换，结合条件表达式实现。

Record类与普通类相比有几个重要限制：

不能继承其他类，只能实现接口
不能声明实例字段，只能使用组件字段
所有字段都是final
不能显式声明父类

这些限制的设计意图是确保Record作为纯数据容器的不可变性和透明性，简化数据类的定义，并避免与继承相关的复杂性。

模式匹配在处理复杂数据结构时的优势包括：

简化类型检查和转换，减少样板代码
支持解构复杂嵌套对象，直接访问内部字段
提高代码可读性，使意图更明确
减少错误，编译器可以检查模式的完整性
与switch表达式结合，可以优雅处理多种类型和条件

5. 密封类（Sealed Classes）（Java 17）

密封类通过permits关键字明确指定哪些类可以继承或实现它，提供了比final更灵活、比开放继承更受控的继承模型。

java

// 密封类定义
public sealed class Shape permits Circle, Rectangle, Triangle {
    // 共享方法和属性
    public abstract double area();
}

// 允许的子类
public final class Circle extends Shape {
    private final double radius;
    
    public Circle(double radius) {
        this.radius = radius;
    }
    
    @Override
    public double area() {
        return Math.PI * radius * radius;
    }
}

public final class Rectangle extends Shape {
    private final double width;
    private final double height;
    
    public Rectangle(double width, double height) {
        this.width = width;
        this.height = height;
    }
    
    @Override
    public double area() {
        return width * height;
    }
}

public non-sealed class Triangle extends Shape {
    // non-sealed允许进一步继承
    private final double base;
    private final double height;
    
    public Triangle(double base, double height) {
        this.base = base;
        this.height = height;
    }
    
    @Override
    public double area() {
        return 0.5 * base * height;
    }
}

// 与模式匹配结合使用
Shape shape = new Circle(5);
double area = switch (shape) {
    case Circle c -> Math.PI * c.getRadius() * c.getRadius();
    case Rectangle r -> r.getWidth() * r.getHeight();
    case Triangle t -> 0.5 * t.getBase() * t.getHeight();
    // 不需要default分支，编译器知道所有可能的子类
};

实现原理：密封类信息存储在类文件的PermittedSubclasses属性中，JVM在类加载时验证继承关系。

密封类和枚举都限制了类型的可能变体，但有重要区别：

枚举实例数量固定，而密封类的子类可以有任意多实例
枚举所有实例共享相同结构，而密封类的子类可以有不同结构和行为
枚举是单例模式，而密封类子类不是
枚举可以实现接口，而密封类可以参与完整的继承层次

密封类适合表示有限但结构各异的类型集合，如抽象语法树节点或领域模型中的实体类型。

密封类通过限定可能的子类集合，使编译器能够在模式匹配（如switch表达式）中执行穷尽性检查。这意味着：

编译器可以验证是否处理了所有可能的子类型
如果添加新的子类，编译器会标记需要更新的模式匹配代码
不需要default分支来处理"未知"子类
减少运行时类型错误的可能性

6. Vector API：SIMD编程（Java 16-22孵化）

Vector API是Java平台的一项重要增强，旨在提供一种表达式清晰、性能可预测的向量计算机制，使开发者能够充分利用现代CPU的SIMD（Single Instruction Multiple Data，单指令多数据）指令集。

java

// 启用Vector API
// --add-modules jdk.incubator.vector

import jdk.incubator.vector.*;

public class VectorExample {
    public static void main(String[] args) {
        // 定义向量种类（形状）：256位向量，每个元素为int（32位）
        VectorSpecies<Integer> SPECIES = IntVector.SPECIES_256;
        
        // 获取每个向量可以处理的元素数量
        int VECTOR_SIZE = SPECIES.length(); // 256位/32位 = 8个int
        
        // 准备数据
        int[] a = new int[1024];
        int[] b = new int[1024];
        int[] c = new int[1024];
        
        // 初始化数据
        for (int i = 0; i < a.length; i++) {
            a[i] = i;
            b[i] = i * 2;
        }
        
        // 向量化计算：c = a + b
        for (int i = 0; i < a.length; i += VECTOR_SIZE) {
            // 计算当前迭代是否需要掩码（处理数组尾部不足一个完整向量的情况）
            VectorMask<Integer> mask = SPECIES.indexInRange(i, a.length);
            
            // 从数组加载向量
            IntVector va = IntVector.fromArray(SPECIES, a, i, mask);
            IntVector vb = IntVector.fromArray(SPECIES, b, i, mask);
            
            // 执行向量加法
            IntVector vc = va.add(vb);
            
            // 将结果存回数组
            vc.intoArray(c, i, mask);
        }
        
        // 验证结果
        for (int i = 0; i < a.length; i++) {
            if (c[i] != a[i] + b[i]) {
                System.err.println("Validation failed at index " + i);
                return;
            }
        }
        System.out.println("Vector computation successful!");
    }
}

SIMD基础与原理： SIMD（单指令多数据）是一种并行计算技术，允许单个指令同时对多个数据元素执行相同的操作。例如，一个128位的SIMD寄存器可以同时处理4个32位整数或浮点数。

传统的标量计算逐个处理元素：

java

for (int i = 0; i < a.length; i++) {
    c[i] = a[i] + b[i];
}

而SIMD向量计算可以同时处理多个元素：

java

// 概念表示，实际实现通过Vector API
for (int i = 0; i < a.length; i += 4) {
    [c[i], c[i+1], c[i+2], c[i+3]] = [a[i], a[i+1], a[i+2], a[i+3]] + [b[i], b[i+1], b[i+2], b[i+3]];
}

Vector API架构： Vector API的核心组件包括：

Vector：表示固定大小的向量，包含特定类型的元素（如byte、int、float、double）
VectorSpecies：定义向量的元素类型和大小（形状）
VectorMask：用于条件操作的掩码
VectorShuffle：用于重排向量元素

Vector API采用了"形状优先"的设计理念，开发者首先选择向量的形状（元素类型和数量），然后在此基础上执行操作。这种设计使编译器能够更好地优化代码，生成高效的SIMD指令。

高级操作示例：

java

// 条件操作与掩码
VectorMask<Integer> gtMask = va.compare(VectorOperators.GT, 100);
IntVector result = va.blend(vb, gtMask); // 如果va>100，选择vb的值，否则选择va的值

// 向量重排与洗牌
int[] indices = new int[SPECIES.length()];
for (int i = 0; i < indices.length; i++) {
    indices[i] = indices.length - 1 - i;
}
VectorShuffle<Integer> reverseOrder = VectorShuffle.fromArray(SPECIES, indices, 0);
IntVector reversed = va.rearrange(reverseOrder);

// 归约操作
int sum = va.reduceLanes(VectorOperators.ADD); // 计算向量所有元素的和
int max = va.reduceLanes(VectorOperators.MAX); // 找出向量中的最大值

实际应用场景：

图像处理：

java

// 图像灰度转换示例
public void convertToGrayscale(byte[] rgbData, byte[] grayData, int width, int height) {
    VectorSpecies<Byte> SPECIES = ByteVector.SPECIES_PREFERRED;
    int VECTOR_SIZE = SPECIES.length();
    
    // RGB权重（标准灰度转换：Gray = 0.299R + 0.587G + 0.114B）
    // 为简化，这里使用整数近似：Gray = (3R + 6G + 1B) / 10
    byte[] rWeight = new byte[VECTOR_SIZE];
    byte[] gWeight = new byte[VECTOR_SIZE];
    byte[] bWeight = new byte[VECTOR_SIZE];
    
    for (int i = 0; i < VECTOR_SIZE; i++) {
        rWeight[i] = 3;
        gWeight[i] = 6;
        bWeight[i] = 1;
    }
    
    ByteVector vRWeight = ByteVector.fromArray(SPECIES, rWeight, 0);
    ByteVector vGWeight = ByteVector.fromArray(SPECIES, gWeight, 0);
    ByteVector vBWeight = ByteVector.fromArray(SPECIES, bWeight, 0);
    
    // 每个像素3字节（RGB）
    int pixelCount = width * height;
    int byteCount = pixelCount * 3;
    
    for (int i = 0; i < byteCount; i += VECTOR_SIZE * 3) {
        int remaining = Math.min(VECTOR_SIZE, (byteCount - i) / 3);
        VectorMask<Byte> mask = SPECIES.maskAll(true).fromLong(
            (1L << remaining) - 1);
        
        // 加载RGB分量
        ByteVector vR = ByteVector.fromArray(SPECIES, rgbData, i, mask);
        ByteVector vG = ByteVector.fromArray(SPECIES, rgbData, i + VECTOR_SIZE, mask);
        ByteVector vB = ByteVector.fromArray(SPECIES, rgbData, i + VECTOR_SIZE * 2, mask);
        
        // 计算灰度值
        ByteVector vGray = vR.mul(vRWeight)
                            .add(vG.mul(vGWeight))
                            .add(vB.mul(vBWeight))
                            .div((byte)10);
        
        // 存储灰度值
        vGray.intoArray(grayData, i / 3, mask);
    }
}

科学计算：矩阵乘法：

java

// 矩阵乘法示例（C = A * B）
public void matrixMultiply(float[][] A, float[][] B, float[][] C, int n) {
    VectorSpecies<Float> SPECIES = FloatVector.SPECIES_PREFERRED;
    int VECTOR_SIZE = SPECIES.length();
    
    for (int i = 0; i < n; i++) {
        for (int j = 0; j < n; j += VECTOR_SIZE) {
            // 确定是否需要掩码
            VectorMask<Float> mask = SPECIES.indexInRange(j, n);
            
            // 初始化结果向量为0
            FloatVector vC = FloatVector.zero(SPECIES);
            
            // 计算点积
            for (int k = 0; k < n; k++) {
                // 广播A[i][k]到整个向量
                FloatVector vA = FloatVector.broadcast(SPECIES, A[i][k]);
                
                // 加载B的一行
                FloatVector vB = FloatVector.fromArray(SPECIES, B[k], j, mask);
                
                // 累加乘积
                vC = vA.fma(vB, vC); // vC = vA * vB + vC
            }
            
            // 存储结果
            vC.intoArray(C[i], j, mask);
        }
    }
}

金融计算：蒙特卡洛模拟：

java

// 使用向量化蒙特卡洛方法估算期权价格
public double estimateOptionPrice(double s0, double strike, double r, 
                                 double sigma, double t, int simulations) {
    VectorSpecies<Double> SPECIES = DoubleVector.SPECIES_PREFERRED;
    int VECTOR_SIZE = SPECIES.length();
    
    // 预计算常量
    double dt = t;
    double drift = (r - 0.5 * sigma * sigma) * dt;
    double vol = sigma * Math.sqrt(dt);
    
    // 创建随机数生成器
    Random random = new Random();
    double[] gaussianRandom = new double[simulations];
    for (int i = 0; i < simulations; i++) {
        gaussianRandom[i] = random.nextGaussian();
    }
    
    // 向量化常量
    DoubleVector vDrift = DoubleVector.broadcast(SPECIES, drift);
    DoubleVector vVol = DoubleVector.broadcast(SPECIES, vol);
    DoubleVector vS0 = DoubleVector.broadcast(SPECIES, s0);
    DoubleVector vStrike = DoubleVector.broadcast(SPECIES, strike);
    DoubleVector vZero = DoubleVector.zero(SPECIES);
    
    double sumPayoffs = 0.0;
    
    // 向量化蒙特卡洛模拟
    for (int i = 0; i < simulations; i += VECTOR_SIZE) {
        VectorMask<Double> mask = SPECIES.indexInRange(i, simulations);
        
        // 加载随机数
        DoubleVector vRandom = DoubleVector.fromArray(SPECIES, gaussianRandom, i, mask);
        
        // 计算股票价格路径
        DoubleVector vPath = vS0.mul(
            DoubleVector.exp(SPECIES, vDrift.add(vVol.mul(vRandom)), mask)
        );
        
        // 计算期权收益
        DoubleVector vPayoff = vPath.sub(vStrike).max(vZero);
        
        // 累加收益
        sumPayoffs += vPayoff.reduceLanes(VectorOperators.ADD, mask);
    }
    
    // 计算期权价格（现值）
    return Math.exp(-r * t) * (sumPayoffs / simulations);
}

性能优化技巧：

选择合适的向量大小：

java

// 获取当前平台的首选向量大小
VectorSpecies<Integer> PREFERRED_SPECIES = IntVector.SPECIES_PREFERRED;

内存对齐：

java

// 检查内存对齐
boolean aligned = ((address & (SPECIES.vectorByteSize() - 1)) == 0);

// 对齐加载（如果支持）
IntVector va = aligned ? 
    IntVector.fromArray(SPECIES, a, i) :
    IntVector.fromArray(SPECIES, a, i, mask);

循环展开：

java

for (int i = 0; i < a.length; i += VECTOR_SIZE * 4) {
    // 处理4个向量
    IntVector va1 = IntVector.fromArray(SPECIES, a, i);
    IntVector vb1 = IntVector.fromArray(SPECIES, b, i);
    IntVector vc1 = va1.add(vb1);
    vc1.intoArray(c, i);
    
    // 重复3次...
}

性能对比：在典型应用场景中，Vector API相比传统标量计算可以带来显著的性能提升：

简单操作（如加法）：3-5倍
复杂操作（如三角函数）：5-10倍
复杂算法（如FFT）：2-4倍

性能提升与底层硬件的SIMD支持密切相关：

AVX-512支持的x86处理器：最高可达10倍加速
AVX2支持的x86处理器：4-6倍加速
NEON支持的ARM处理器：3-5倍加速

局限性与注意事项：

硬件依赖性：实际性能依赖于底层硬件的SIMD支持
适用场景限制：不适合数据量小、访问模式不规则或控制流复杂的场景
API稳定性：由于仍处于孵化阶段，API可能在未来版本中变化
学习曲线：需要理解SIMD原理、向量操作和内存对齐等概念

三、JVM特性与垃圾收集器原理

1. G1垃圾收集器（Java 9默认）

G1（Garbage-First）是一种区域化、分代式、增量垃圾收集器，旨在平衡吞吐量和停顿时间。它将堆划分为多个大小相等的区域（Region），可以选择性地回收垃圾最多的区域，实现可预测的停顿时间。

工作流程：

初始标记（STW）：标记GC Roots直接引用的对象，停顿时间很短。
并发标记：遍历对象图，标记活跃对象，与应用并发执行。
最终标记（STW）：处理并发标记阶段的引用更新，使用SATB（Snapshot-At-The-Beginning）算法。
清理（部分STW）：计算各区域存活对象比例，选择回收价值最高的区域进行回收。
复制/疏散（STW）：将选定区域的存活对象复制到空闲区域，回收原区域。

内存布局：

堆被划分为大小相等的区域（默认2048个区域）
每个区域可以是Eden、Survivor、Old或Humongous（大对象）
区域大小默认为堆大小/2048，通常在1MB到32MB之间

# G1 GC关键参数
-XX:+UseG1GC                     # 启用G1垃圾收集器
-XX:MaxGCPauseMillis=200         # 目标最大停顿时间（毫秒）
-XX:G1HeapRegionSize=n           # 区域大小，必须是2的幂，范围1MB到32MB
-XX:InitiatingHeapOccupancyPercent=45  # 触发并发标记的堆占用率阈值
-XX:G1NewSizePercent=5           # 新生代最小空间占比
-XX:G1MaxNewSizePercent=60       # 新生代最大空间占比
-XX:G1ReservePercent=10          # 预留空间百分比，防止晋升失败

G1相比CMS的主要优势和不同点：

内存布局：G1使用区域化内存布局，而CMS使用传统的新生代/老年代
碎片处理：G1在回收过程中整理内存，减少碎片，而CMS不进行压缩，容易产生碎片
可预测性：G1允许设置停顿时间目标，而CMS专注于最小化停顿
回收范围：G1可以同时回收新生代和老年代（Mixed GC），而CMS主要针对老年代
算法：G1使用复制算法和SATB，CMS使用标记-清除算法和增量更新
并发失败处理：G1的退化收集器是串行GC，而CMS的退化收集器是Serial Old

G1实现可预测停顿时间的机制包括：

区域化内存管理，允许增量回收
停顿预测模型，根据历史数据预测各区域的回收时间
优先回收价值最高的区域（垃圾最多的区域）
动态调整回收集（collection set）大小，以满足停顿时间目标
自适应调整新生代大小
并发标记减少停顿时间
使用SATB算法减少重新标记阶段的工作量

2. ZGC（Z Garbage Collector）（Java 15产品化）

ZGC是一种低延迟垃圾收集器，设计目标是停顿时间不超过10ms，且不随堆大小增加而增加。它通过着色指针（Colored Pointers）和读屏障（Load Barrier）技术实现并发的标记、整理和复制。

工作流程：

并发标记：标记所有可达对象，使用着色指针和读屏障处理并发修改。
并发引用处理：处理弱引用、软引用等特殊引用。
并发重定位准备：选择需要重定位（压缩）的区域。
并发重定位：将存活对象复制到新位置，使用读屏障确保访问最新位置。

关键技术：

着色指针：在64位指针的未使用位中存储对象状态信息，用于并发标记和重定位。
读屏障：在读取对象引用时检查指针状态，确保访问正确的对象位置。
多重映射：同一物理内存可以有多个虚拟内存映射，用于支持并发重定位。

# ZGC关键参数
-XX:+UseZGC                      # 启用ZGC垃圾收集器
-XX:+ZGenerational               # 启用分代ZGC（JDK 21+）
-XX:ZCollectionInterval=n        # 两次GC之间的最小时间间隔（秒）
-XX:ZAllocationSpikeTolerance=n  # 分配尖峰容忍度，控制GC触发敏感度
-XX:+ZProactive                  # 启用主动GC，在应用空闲时执行GC
-XX:ZFragmentationLimit=n        # 碎片化限制，控制内存压缩频率

分代ZGC（Java 21）：

将堆分为年轻代和老年代，分别进行收集
年轻代使用复制算法，老年代使用标记-压缩算法
减少全堆扫描，提高GC效率

ZGC实现低延迟的关键技术包括：

着色指针：在指针中嵌入元数据，避免全堆扫描
读屏障：在对象引用加载时执行，确保访问最新对象位置
并发处理：几乎所有GC操作都与应用并发执行，包括标记、整理和复制
多重映射：同一物理内存映射到多个虚拟地址，支持并发重定位
增量处理：将GC工作分散到多个小周期
NUMA感知：优化在NUMA架构上的性能

ZGC适用场景：

对延迟极其敏感的应用，如金融交易、游戏服务器
大内存应用（>32GB）
需要一致低延迟的实时系统
高并发、高吞吐量的在线交易系统

限制包括：

CPU使用率较高，需要更多计算资源
内存占用略高于G1
在小内存场景下可能不如G1高效
对某些JVM特性支持有限，如类卸载在早期版本不支持

分代ZGC（JDK 21+）的主要改进：

减少全堆扫描，只需扫描年轻代或老年代
利用对象年龄分布特性，大多数对象在年轻代就会死亡
年轻代收集更频繁但更快
老年代收集频率降低
整体吞吐量提升，在某些工作负载下可提高30%
内存使用效率提高
与非分代ZGC保持相同的低延迟特性

3. Shenandoah垃圾收集器（Java 12引入）

Shenandoah是一种低延迟垃圾收集器，与ZGC类似，但实现方式不同。它通过Brooks指针（转发指针）和读写屏障实现并发的标记和整理，目标是在任何堆大小下都保持较低的停顿时间。

工作流程：

初始标记（STW）：标记GC Roots直接引用的对象，停顿时间很短。
并发标记：遍历对象图，标记活跃对象，与应用并发执行。
最终标记（STW）：处理剩余的SATB缓冲区。
并发清理：回收没有存活对象的区域。
并发疏散：将存活对象复制到新区域，使用Brooks指针和读写屏障处理并发访问。
最终疏散（STW）：完成剩余的疏散工作。
并发清理：回收原区域。

关键技术：

Brooks指针：每个对象都有一个额外的字段指向对象的当前位置，用于处理并发移动。
读写屏障：在读取或修改对象引用时检查和更新引用，确保访问正确的对象位置。
启发式算法：根据不同工作负载特性选择最佳收集策略。

# Shenandoah关键参数
-XX:+UseShenandoahGC             # 启用Shenandoah垃圾收集器
-XX:ShenandoahGCHeuristics=adaptive  # 设置启发式策略（adaptive/static/compact/aggressive）
-XX:ShenandoahInitFreeThreshold=n    # 初始空闲阈值百分比
-XX:ShenandoahMinFreeThreshold=n     # 最小空闲阈值百分比
-XX:+ShenandoahGenerational      # 启用分代Shenandoah（实验性）

Shenandoah与ZGC的主要区别：

引用跟踪机制：Shenandoah使用Brooks指针（对象内的转发指针），ZGC使用着色指针（指针本身包含元数据）
内存开销：Shenandoah每个对象增加一个指针字段，ZGC利用未使用的指针位
屏障实现：Shenandoah使用读写屏障，ZGC主要使用读屏障
并发策略：Shenandoah有更多的STW阶段，ZGC几乎完全并发
内存布局：两者都使用区域化内存，但内部实现不同
支持平台：Shenandoah支持32位系统，ZGC仅支持64位系统
开发背景：Shenandoah由Red Hat开发，ZGC由Oracle开发

Shenandoah提供四种启发式算法：

Adaptive：默认模式，自动调整GC频率和行为以平衡延迟和吞吐量，适合大多数应用
Static：固定的GC周期，适合负载稳定的应用
Compact：更激进的内存压缩，适合内存受限环境
Aggressive：非常频繁的GC，最小化内存占用，适合多租户环境

4. 垃圾收集器选型指南

应用类型	推荐GC	备选GC	说明
微服务	G1	ZGC	微服务通常内存较小，G1在这种场景下表现良好
大型单体应用	ZGC	G1	大型应用通常内存较大，ZGC能提供更一致的低延迟
批处理作业	Parallel GC	G1	批处理关注吞吐量而非延迟，Parallel GC更适合
实时交易系统	ZGC	Shenandoah	交易系统对延迟极其敏感，ZGC提供最低延迟
数据分析应用	G1	Parallel GC	数据分析需要平衡吞吐量和延迟，G1较为适合

按内存大小选择：

<4GB：G1或Parallel GC
4GB-32GB：G1
32GB-128GB：ZGC或Shenandoah
128GB：ZGC

按延迟要求选择：

极低延迟(<10ms)：ZGC
低延迟(10-100ms)：Shenandoah或ZGC
中等延迟(100-500ms)：G1
高吞吐量优先：Parallel GC

四、其他重要特性与技术细节

1. 模块系统（Java 9 Jigsaw）

模块系统允许将Java应用打包为模块，每个模块明确声明其依赖和导出的包，实现强封装和可靠配置。

java

// module-info.java
module com.example.app {
    requires java.base;        // 基础模块（隐式包含）
    requires java.sql;         // 依赖JDBC API
    requires transitive com.example.core;  // 传递依赖
    
    exports com.example.app.api;  // 导出公共API包
    exports com.example.app.model to com.example.client;  // 限定导出
    
    provides com.example.spi.Service with com.example.app.impl.ServiceImpl;  // 服务提供
    uses com.example.spi.Plugin;  // 服务消费
}

Java模块系统的主要优势包括：

强封装：明确控制哪些包可见，防止内部API泄露
显式依赖：清晰声明模块间依赖关系
可靠配置：编译时和启动时验证依赖完整性
平台模块化：JDK本身被模块化，可以创建自定义运行时
更好的性能：通过模块路径优化类加载
更小的运行时：使用jlink创建仅包含必要模块的自定义运行时
服务加载机制：标准化的服务提供和消费模型

迁移到模块系统的步骤：

使用jdeps工具分析依赖，特别是对JDK内部API的依赖
重构代码，移除对内部API的依赖
组织包结构，确保API和实现分离
创建module-info.java文件，声明模块依赖和导出
处理服务加载器模式，使用provides/uses替代META-INF/services
处理反射访问，使用opens声明
考虑自动模块作为过渡方案
逐步迁移，可以混合使用模块和非模块代码

2. 文本块与字符串模板（Java 15-21）

文本块使用三重双引号定义多行字符串，保留格式并简化转义。字符串模板允许在字符串中嵌入表达式，类似JavaScript的模板字符串。

java

// 文本块（Java 15+）
String sql = """
            SELECT id, name, email
            FROM users
            WHERE status = 'ACTIVE'
              AND last_login > ?
            ORDER BY name
            """;

// 字符串模板（Java 21预览）
String name = "Alice";
int age = 30;
String message = STR."Hello, \{name}! Next year you'll be \{age + 1}.";

// 自定义模板处理器
String json = JSON."""
    {
      "name": "\{name}",
      "age": \{age},
      "isAdult": \{age >= 18}
    }
    """;

文本块的优势包括：

可读性：保留多行格式，代码结构更清晰
简化转义：不需要转义引号和大多数特殊字符
减少错误：避免忘记换行符或连接符的错误
缩进控制：可以通过\s控制空白字符保留
性能：编译器可以优化文本块，而字符串连接可能创建多个中间对象
维护性：修改大型文本更容易，不需要调整每行末尾的连接符

字符串模板与文本块的区别：

目的：文本块解决多行文本格式问题，字符串模板解决值插值问题
语法：文本块使用三重双引号，字符串模板使用处理器前缀和表达式插值
处理时机：文本块在编译时处理，字符串模板在运行时处理表达式
扩展性：字符串模板支持自定义处理器，文本块不可扩展

3. 外部内存访问API（Java 21预览）

外部内存访问API提供安全、高效的方式访问堆外内存，替代Unsafe和JNI，支持与本地代码交互和处理大数据集。

java

// 使用外部内存访问API
// 分配堆外内存
try (Arena arena = Arena.ofConfined()) {
    // 分配100个int的空间
    MemorySegment segment = arena.allocate(100 * Integer.BYTES);
    
    // 获取内存段的地址
    MemoryAddress address = segment.address();
    
    // 创建int数组视图
    VarHandle intHandle = MemoryHandles.varHandle(int.class, ByteOrder.nativeOrder());
    
    // 写入数据
    for (int i = 0; i < 100; i++) {
        intHandle.set(segment, (long) i * Integer.BYTES, i * 10);
    }
    
    // 读取数据
    int value = (int) intHandle.get(segment, 5L * Integer.BYTES); // 获取第6个元素
    System.out.println("Value at index 5: " + value);
    
    // 批量操作
    int sum = 0;
    for (int i = 0; i < 100; i++) {
        sum += (int) intHandle.get(segment, (long) i * Integer.BYTES);
    }
    System.out.println("Sum of all values: " + sum);
}
// 内存自动释放

外部内存访问API解决了以下问题：