lambda表达式底层实现

秋夫人

已于 2024-10-01 00:04:59 修改

阅读量359

点赞数 22

分类专栏： java 文章标签：开发语言 java

于 2024-09-30 14:47:39 首次发布

本文链接：https://blog.csdn.net/wangnanwlw/article/details/142605060

版权

java 专栏收录该内容

96 篇文章 5 订阅

订阅专栏

一、lambda 代码 & 反编译

原始Java代码
假设我们有以下简单的Java程序，它使用Lambda表达式来遍历并打印一个字符串列表：

import java.util.Arrays;
import java.util.List;

public class LambdaExample {
    public static void main(String[] args) {
        List<String> items = Arrays.asList("Apple", "Banana", "Cherry");
        items.forEach(item -> System.out.println(item));
    }
}

public interface Iterable<T> {
	default void forEach(Consumer<? super T> action) {
	        Objects.requireNonNull(action);
	        for (T t : this) {
	            action.accept(t);
	        }
	    }
}

CFR反编译结果：

/*
 * Decompiled with CFR 0.152.
 */
import java.lang.invoke.LambdaMetafactory;
import java.util.Arrays;
import java.util.List;
import java.util.function.Consumer;

public class LambdaExample {
    public static void main(String[] stringArray) {
        List<String> list = Arrays.asList("Apple", "Banana", "Cherry");
        list.forEach(
        (Consumer<String>)LambdaMetafactory.metafactory(
        null, 
        null, 
        null, 
        (Ljava/lang/Object;)V, 
        lambda$main$0(java.lang.String ), 
        (Ljava/lang/String;)V)());
    }

    private static /* synthetic */ void lambda$main$0(String string) {
        System.out.println(string);
    }
}

这是程序的主方法，它创建了一个包含三个字符串的列表，并使用forEach方法遍历这个列表。在原始的Java代码中，这里很可能使用了一个Lambda表达式来打印列表中的每个元素。在反编译的代码中，Lambda表达式被转换成了对LambdaMetafactory.metafactory方法的调用，这个方法在运行时动态生成了一个实现了Consumer接口的类的实例。因为forEach方法入参就是一个函数式接口Consumer<? super T>，即：最终返回Consumer实例对象

二、反编译代码详解

2.1 LambdaMetafactory lambda元工厂类方法：metafactory

/**
	 * 为了支持Java编程语言中的ambda表达式和方法引用表达式特性，
	 * 本方法提供了一种简便的方式来创建实现一个或多个接口的“函数对象”。这些函数对象是通过委托给一个提供的{@link MethodHandle}，
	 * 在适当的类型适配和参数的部分求值之后实现的。通常作为{@code invokedynamic}调用点的<em>引导方法</em>使用。
	 *
	 * <p>这是标准的、简化的元工厂方法；通过{@link #altMetafactory(MethodHandles.Lookup, String, MethodType, Object...)}
	 * 提供了额外的灵活性。关于此方法的行为的一般描述，请参见{@link LambdaMetafactory}。
	 *
	 * <p>当从此方法返回的{@code CallSite}的目标被调用时，生成的函数对象是实现由{@code invokedType}的返回类型命名的接口的类的实例，
	 * 声明了一个具有由{@code invokedName}和{@code samMethodType}给出的名称和签名的方法。它还可能覆盖来自{@code Object}的额外方法。
	 *
	 * @param caller 表示具有调用者访问权限的查找上下文。当与{@code invokedynamic}一起使用时，这由VM自动堆叠。
	 * @param invokedName 要实现的方法的名称。当与{@code invokedynamic}一起使用时，这由{@code InvokeDynamic}结构的{@code NameAndType}提供，并由VM自动堆叠。
	 * @param invokedType {@code CallSite}的预期签名。参数类型代表捕获变量的类型；返回类型是要实现的接口。当与{@code invokedynamic}一起使用时，这由{@code InvokeDynamic}结构的{@code NameAndType}提供，并由VM自动堆叠。如果实现方法是实例方法并且此签名有任何参数，则调用签名中的第一个参数必须对应于接收者。
	 * @param samMethodType 函数对象要实现的方法的签名和返回类型。
	 * @param implMethod 描述应在调用时调用的实现方法的直接方法句柄（适当地适配参数类型、返回类型，并将捕获的参数前置到调用参数中）。
	 * @param instantiatedMethodType 应在调用时动态强制执行的签名和返回类型。这可能与{@code samMethodType}相同，或可能是其特化版本。
	 * @return 一个CallSite，其目标可用于执行捕获，生成由{@code invokedType}命名的接口的实例
	 * @throws LambdaConversionException 如果违反了{@link LambdaMetafactory}中描述的任何链接不变量
	 */
    public static CallSite metafactory(MethodHandles.Lookup caller,
                                       String invokedName,
                                       MethodType invokedType,
                                       MethodType samMethodType,
                                       MethodHandle implMethod,
                                       MethodType instantiatedMethodType)
            throws LambdaConversionException {
         // 创建一个内部类Lambda元工厂实例，用于生成和验证lambda表达式的实现
		 AbstractValidatingLambdaMetafactory mf;
		 mf = new InnerClassLambdaMetafactory(caller, invokedType,
                                             invokedName, samMethodType,
                                             implMethod, instantiatedMethodType,
                                             false, EMPTY_CLASS_ARRAY, EMPTY_MT_ARRAY);
        // 验证元工厂方法的参数是否符合要求
        mf.validateMetafactoryArgs();
        // 构建并返回一个CallSite，它是lambda表达式或方法引用的动态调用点
        return mf.buildCallSite();
    }

java.lang.invoke.LambdaMetafactory#metafactory 详解

metafactory是LambdaMetafactory中的一个静态方法，用于支持lambda表达式和方法引用表达式的动态实现。它是LambdaMetafactory类的一部分，该类是Java语言中lambda表达式和方法引用的底层支持机制。下面是对这段代码的详细解释：

方法的作用和目的：
这个方法的目的是为了动态创建一个实现特定接口的"函数对象"。这个函数对象通过委托给一个提供的MethodHandle（方法句柄），在适当的类型适配和参数的部分求值后，实现一个或多个接口。这通常用作invokedynamic调用点的引导方法（bootstrap method），以支持Java编程语言中的lambda表达式和方法引用表达式特性。
参数：
- 方法接收六个参数：caller、invokedName、invokedType、samMethodType、implMethod和instantiatedMethodType。
  - caller：调用者，这个例子中就是LambdaExample类的MethodHandles.Lookup实例_{(每个类都可以通过调用MethodHandles.lookup()静态方法来获取一个与该类对应的MethodHandles.Lookup实例。这个Lookup实例代表了调用者的类，并且拥有创建方法句柄（MethodHandle）的权限，这些方法句柄可以访问调用者类中的成员，包括私有成员。)}，这个实例具有访问LambdaExample类中所有成员的权限。该参数是jvm自动填充。
  - invokedName：被调用方法的名称，在这个例子中，forEach方法接受一个java.util.function.Consumer类型的参数。Consumer接口定义了一个名为accept的抽象方法。因此，在这个上下文中，invokedName将是accept。该参数是jvm自动填充。
  - invokedType：被调用方法的签名类型，这是一个java.lang.invoke.MethodType对象。在lambda表达式或方法引用的上下文中，invokedType描述了期望的调用点的签名，包括参数类型和返回类型。具体来说，invokedType参数定义了：
    ①调用点期望的参数类型，这些参数类型代表了lambda表达式或方法引用捕获的变量类型（如果有的话）。
    ②调用点期望的返回类型，这通常是一个函数式接口的类型，lambda表达式或方法引用将会生成一个实现了这个接口的对象。在这个例子中，forEach方法接受一个java.util.function.Consumer类型的参数。Consumer接口定义了一个接受单个String参数且返回void的accept方法。因此，在这个上下文中，invokedType将是Consumer的方法签名，即接受一个String参数且返回void的方法类型。该参数是jvm自动填充。
  - samMethodType：java.lang.invoke.LambdaMetafactory#metafactory方法的参数samMethodType指的是单抽象方法（Single Abstract Method, SAM）的方法类型。这是一个java.lang.invoke.MethodType对象，它描述了目标函数式接口中单个抽象方法的签名，包括参数类型和返回类型。
    在使用lambda表达式或方法引用时，通常会有一个函数式接口作为目标类型。函数式接口是指仅定义一个抽象方法的接口。samMethodType参数正是用来描述这个抽象方法的签名。在这个例子中，forEach方法接受一个java.util.function.Consumer类型的参数。Consumer是一个函数式接口，它定义了一个名为accept的抽象方法，该方法接受一个类型为T的参数并返回void。对于这个特定的例子，T是String类型，因此accept方法的签名是(String) -> void。
  - implMethod：java.lang.invoke.LambdaMetafactory#metafactory方法的参数implMethod指的是实现方法的MethodHandle。这个MethodHandle代表了lambda表达式或方法引用的实际实现体。在lambda表达式或方法引用被转换成动态方法调用时，implMethod就是那个被调用以执行具体操作的方法。
    具体来说，implMethod参数描述了：
    ①方法的实现：这是lambda表达式或方法引用中定义的逻辑的实际代码位置。
    ②方法的签名：通过MethodHandle的类型，它还隐含地指定了方法的参数类型和返回类型。
    在这个例子中，lambda表达式item -> System.out.println(item)对应的implMethod就是System.out.println(String)方法的MethodHandle。这个MethodHandle指向PrintStream类中的println(String)方法，这是因为System.out是一个PrintStream的实例。
  - instantiatedMethodType：指的是实例化方法的类型。这是一个java.lang.invoke.MethodType对象，它描述了在生成的lambda表达式或方法引用的实例中，目标方法的签名。具体来说，它定义了lambda表达式或方法引用在实现函数式接口时，该接口中抽象方法的调用签名，包括参数类型和返回类型。在这个例子中，forEach方法接受一个java.util.function.Consumer类型的参数。Consumer是一个函数式接口，它定义了一个名为accept的抽象方法，该方法接受一个类型为String的参数并返回void。因此，对于这个特定的例子，instantiatedMethodType将是描述accept方法签名的MethodType对象，即接受一个String参数且返回void的方法类型。
逻辑解释：
- AbstractValidatingLambdaMetafactory mf;：声明一个AbstractValidatingLambdaMetafactory类型的变量mf，这是一个抽象类，用于验证lambda工厂的参数。
- mf = new InnerClassLambdaMetafactory(caller, invokedType, invokedName, samMethodType, implMethod, instantiatedMethodType, false, EMPTY_CLASS_ARRAY, EMPTY_MT_ARRAY);：实例化mf为InnerClassLambdaMetafactory对象，这个对象负责创建实现特定接口的函数对象。传入的参数包括调用者的查找上下文、被调用方法的名称和类型、SAM（Single Abstract Method）接口的方法类型、实现方法的方法句柄、以及实例化方法的类型。false表示这个lambda对象不需要是可序列化的，EMPTY_CLASS_ARRAY和EMPTY_MT_ARRAY分别表示没有额外的接口和方法类型需要被实现或适配。
- mf.validateMetafactoryArgs();：调用mf的validateMetafactoryArgs方法进行参数验证，确保传入的参数满足lambda表达式和方法引用的链接要求。
- return mf.buildCallSite();：调用mf的buildCallSite方法构建并返回一个CallSite对象，这个对象的目标可以用来执行捕获，生成实现了指定接口的实例。
CallSite是Java中的一个类，它代表了一个动态方法调用点。在Java7的动态语言支持中，CallSite提供了一种机制，允许方法调用的行为在运行时动态改变，而不是在编译时静态确定。这对于实现动态类型语言或支持某些高级动态特性的静态类型语言（如Java中的lambda表达式和方法引用）非常有用。CallSite对象包含一个称为目标（target）的MethodHandle，这个MethodHandle实际上定义了调用点的行为。当对CallSite进行方法调用时，实际上是在调用其目标MethodHandle。
Java中的CallSite有几种不同的类型，包括：
- MethodHandleNatives.CallSite：这是最基本的CallSite，直接关联一个MethodHandle作为其调用目标。
- ConstantCallSite：一个不可变的CallSite，其目标在构造时被设置，并且之后不能改变。这对于那些不需要改变的方法调用非常有用，可以提供更好的性能。
- MutableCallSite：一个可变的CallSite，允许改变其目标MethodHandle。这对于需要根据运行时条件改变调用行为的情况非常有用。
- VolatileCallSite：类似于MutableCallSite，但是对目标MethodHandle的更新是volatile的，确保了线程安全。
CallSite和MethodHandle是Java对动态语言特性的支持的核心部分，它们使得Java能够以更灵活和动态的方式处理方法调用，支持如lambda表达式和方法引用等现代编程特性。

metafactory方法返回的调用点是CallSite的一个实例。具体来说，根据LambdaMetafactory的实现，它通常返回的是ConstantCallSite的一个实例。ConstantCallSite是CallSite的一个子类，它表示一个不可变的调用点。一旦ConstantCallSite的目标方法句柄（MethodHandle）被设置，它就不会改变。这种特性使得ConstantCallSite非常适合于lambda表达式和方法引用的场景，因为这些场景中的目标方法通常在创建时就已经确定，并且在其生命周期内不需要改变。
·
在LambdaMetafactory的上下文中，metafactory方法通过动态生成的类来实现函数接口，并创建一个指向这个实现的方法句柄（MethodHandle）。然后，这个方法句柄被用作ConstantCallSite的目标，从而创建一个CallSite实例。这个CallSite实例在被调用时，会直接调用那个实现了函数接口的动态生成类的方法。

这段代码通过动态创建和配置CallSite对象，支持了Java中lambda表达式和方法引用表达式的动态实现。

2.2、InnerClassLambdaMetafactory

InnerClassLambdaMetafactory构造函数、buildCallSite构建CallSite调用点

 /**
	 * 构造函数：创建一个内部类Lambda元工厂的实例。
	 * 该构造函数用于支持标准情况以及允许序列化或桥接等不常见选项。
	 *
	 * @param caller 由VM自动堆叠；代表具有调用者访问权限的查找上下文。
	 * @param invokedType 由VM自动堆叠；被调用方法的签名，包括返回的lambda对象的预期静态类型，
	 *                    以及lambda捕获参数的静态类型。如果实现方法是实例方法，调用签名的第一个参数将对应于接收者。
	 * @param samMethodName 转换为lambda或方法引用的函数接口中的方法名称，表示为String。
	 * @param samMethodType 转换为lambda或方法引用的函数接口中的方法类型，表示为MethodType。
	 * @param implMethod 应当被调用的实现方法（适当调整参数类型、返回类型和捕获参数后），当调用结果函数接口实例的方法时。
	 * @param instantiatedMethodType 在从捕获站点实例化类型变量后，主要函数接口方法的签名。
	 * @param isSerializable lambda是否应该是可序列化的？如果设置，目标类型或一个附加的SAM类型必须扩展{@code Serializable}。
	 * @param markerInterfaces lambda对象应该实现的附加接口。
	 * @param additionalBridges 额外的签名，这些签名将被桥接到实现方法。
	 * @throws LambdaConversionException 如果违反了元工厂协议的任何不变量。
	 */
    public InnerClassLambdaMetafactory(MethodHandles.Lookup caller,
                                       MethodType invokedType,
                                       String samMethodName,
                                       MethodType samMethodType,
                                       MethodHandle implMethod,
                                       MethodType instantiatedMethodType,
                                       boolean isSerializable,
                                       Class<?>[] markerInterfaces,
                                       MethodType[] additionalBridges)
            throws LambdaConversionException {
        // 调用父类构造函数，初始化基本参数
	    super(caller, invokedType, samMethodName, samMethodType,
	          implMethod, instantiatedMethodType,
	          isSerializable, markerInterfaces, additionalBridges);
	    // 初始化实现方法的类名，将'.'替换为'/'
	    implMethodClassName = implDefiningClass.getName().replace('.', '/');
	    // 初始化实现方法的名称
	    implMethodName = implInfo.getName();
	    // 初始化实现方法的描述符
	    implMethodDesc = implMethodType.toMethodDescriptorString();
	    // 初始化实现方法返回类型的类
	    implMethodReturnClass = (implKind == MethodHandleInfo.REF_newInvokeSpecial)
	            ? implDefiningClass
	            : implMethodType.returnType();
	    // 初始化生成类构造函数的类型
	    constructorType = invokedType.changeReturnType(Void.TYPE);
	    // 生成并初始化lambda类的名称
	    lambdaClassName = targetClass.getName().replace('.', '/') + "$$Lambda$" + counter.incrementAndGet();
	    // 【重要⭐️⭐️⭐️⭐️⭐️】初始化ASM类写入器
	    cw = new ClassWriter(ClassWriter.COMPUTE_MAXS);
	    // 初始化构造函数参数名称和描述符数组
	    int parameterCount = invokedType.parameterCount();
	    if (parameterCount > 0) {
	       // 初始化参数名和参数描述数组，大小为方法参数的数量
			argNames = new String[parameterCount];
			argDescs = new String[parameterCount];
			// 遍历所有参数，生成参数名和参数描述
			for (int i = 0; i < parameterCount; i++) {
			    // 为每个参数生成一个唯一的名称，格式为"arg$序号"
			    argNames[i] = "arg$" + (i + 1);
			    // 使用BytecodeDescriptor工具类将参数类型转换为字符串描述形式
			    argDescs[i] = BytecodeDescriptor.unparse(invokedType.parameterType(i));
			}

	    } else {
	        // 当调用类型参数计数为0时，初始化参数名和参数描述数组为空字符串数组
			argNames = argDescs = EMPTY_STRING_ARRAY;
	    }
    }


   /**
	 * 构建CallSite。生成实现功能接口的类文件，定义类，如果没有参数则创建类的实例，
	 * 该实例将由CallSite返回，否则，生成的句柄将调用类的构造函数。
	 *
	 * @return CallSite，调用时，将返回一个功能接口的实例
	 * @throws ReflectiveOperationException 反射操作异常
	 * @throws LambdaConversionException 如果没有找到正确形式的功能接口
	 */
    @Override
    CallSite buildCallSite() throws LambdaConversionException {
         // 生成实现了函数接口的内部类
	    final Class<?> innerClass = spinInnerClass();
	    // 如果调用类型没有参数，即无需捕获的变量
	    if (invokedType.parameterCount() == 0) {
	        // 通过反射获取一个内部类的所有构造函数，并在只有一个构造函数的情况下，将这个唯一的构造函数设置为可访问的。
	        final Constructor<?>[] ctrs = AccessController.doPrivileged(
	                new PrivilegedAction<Constructor<?>[]>() {
	            @Override
	            public Constructor<?>[] run() {
	            	// 返回了innerClass（内部类）的所有构造函数，包括私有的。
	                Constructor<?>[] ctrs = innerClass.getDeclaredConstructors();
	                if (ctrs.length == 1) {
	                    // 如果只有一个构造函数，设置为可访问
	                    ctrs[0].setAccessible(true);
	                }
	                return ctrs;
	            }
	                });
	        // 确保只有一个构造函数
	        if (ctrs.length != 1) {
	            throw new LambdaConversionException("Expected one lambda constructor for "
	                    + innerClass.getCanonicalName() + ", got " + ctrs.length);
	        }
	
	        try {
	            // 通过构造函数实例化对象
	            Object inst = ctrs[0].newInstance();
	            // 创建并返回一个持有lambda对象的ConstantCallSite
	            return new ConstantCallSite(MethodHandles.constant(samBase, inst));
	        }
	        catch (ReflectiveOperationException e) {
	            throw new LambdaConversionException("Exception instantiating lambda object", e);
	        }
	    } else {
	        // 如果有参数，需要通过静态方法来创建CallSite
	        try {
	            // 确保类已经被完全初始化
	            UNSAFE.ensureClassInitialized(innerClass);
	            // 查找静态方法并创建CallSite
	            return new ConstantCallSite(
	                    MethodHandles.Lookup.IMPL_LOOKUP
	                         .findStatic(innerClass, NAME_FACTORY, invokedType));
	        }
	        catch (ReflectiveOperationException e) {
	            throw new LambdaConversionException("Exception finding constructor", e);
	        }
	    }
    }

/**
	 * 生成并返回一个实现了功能接口的类文件。
	 *
	 * @implNote 生成的类文件不包含SAM方法可能存在的异常签名信息，
	 * 旨在减少类文件大小。这是无害的，因为已检查的异常会被擦除，
	 * 没有人会针对这个类文件进行编译，我们不保证lambda对象的反射属性。
	 *
	 * @return 实现了功能接口的类
	 * @throws LambdaConversionException 如果没有找到正确形式的功能接口
	 */
	private Class<?> spinInnerClass() throws LambdaConversionException {
		// 构建一个字符串数组 interfaces，该数组包含了要实现的接口的内部名称（即将.替换为/的全限定类名），同时确保没有重复的接口，并检查是否意外地实现了 Serializable 接口。
	    String[] interfaces;
	    // 获取函数式接口的内部名称，将.替换为/。
	    String samIntf = samBase.getName().replace('.', '/');
	    // 检查基础函数式接口是否意外实现了 Serializable 接口。
	    boolean accidentallySerializable = !isSerializable && Serializable.class.isAssignableFrom(samBase);
	    // 如果没有额外的标记接口，直接使用函数式接口的内部名称作为 interfaces 的唯一元素。
	    if (markerInterfaces.length == 0) {
	        interfaces = new String[]{samIntf};
	    } else {
	        // 如果 markerInterfaces 非空,确保没有重复的接口（ClassFormatError）,使用 LinkedHashSet 来存储接口名称，确保不会有重复。
	        Set<String> itfs = new LinkedHashSet<>(markerInterfaces.length + 1);
	        // 将函数式接口的内部名称添加到集合中
	        itfs.add(samIntf);
	        // 遍历额外的标记接口，将它们的内部名称添加到集合中，并检查是否意外实现了 Serializable 接口。
	        for (Class<?> markerInterface : markerInterfaces) {
	            itfs.add(markerInterface.getName().replace('.', '/'));
	            accidentallySerializable |= !isSerializable && Serializable.class.isAssignableFrom(markerInterface);
	        }
	        // 将接口名称集合转换为字符串数组。
	        interfaces = itfs.toArray(new String[itfs.size()]);
	    }
		/**
		cw 是 ClassWriter 的实例，它是 ASM（一个通用的 Java 字节码操作和分析框架）库中的一个类。ClassWriter 用于动态生成类或接口的二进制字节码。在上下文中，cw 被用来构建和定义一个新的类，这个类是在运行时动态生成的，用于实现特定的功能接口，通常是为了支持 Java 中的 lambda 表达式。
通过调用 ClassWriter 的方法，如 visit、visitMethod 和 visitField，可以分别定义类的基本信息、方法和字段。最终，通过调用 cw.toByteArray() 方法，可以获取到这个动态生成的类的字节码数组，这个数组可以被加载到 JVM 中，从而创建出一个新的类实例。
		*/
		// 定义了一个类，这个类是final和synthetic的，继承自Object类，并实现了interfaces数组中指定的接口。lambdaClassName是这个类的名称。
		// 其中:
		// 	ACC_FINAL 表示这个类是final的
		//	ACC_SYNTHETIC 表示这个类是synthetic的，synthetic标记表明这个类是由编译器自动生成的，而非直接来自源代码。
		//	lambdaClassName 是动态生成的类名
	    cw.visit(CLASSFILE_VERSION, ACC_SUPER + ACC_FINAL + ACC_SYNTHETIC,
	             lambdaClassName, null,
	             JAVA_LANG_OBJECT, interfaces);
	
	    // 生成构造函数中要填充的最终字段
	    for (int i = 0; i < argDescs.length; i++) {
	    	// 生成一个private final字段来存储这些参数的值。
	        FieldVisitor fv = cw.visitField(ACC_PRIVATE + ACC_FINAL,
	                                        argNames[i],
	                                        argDescs[i],
	                                        null, null);
	        /**
				这行代码的作用是结束一个字段的访问。在ASM中，每当开始定义一个新的字段时，都会通过调用visitField方法返回一个FieldVisitor对象，通过这个对象可以定义字段的属性。当字段的定义结束时，需要调用visitEnd方法来标志这个过程的结束。
			*/                                
	        fv.visitEnd();
	    }
		// 生成构造函数
	    generateConstructor();
		// 判断是检查invokedType（lambda表达式的目标类型）是否有参数。
	    if (invokedType.parameterCount() != 0) {
	    	// 这个方法的作用是生成工厂方法。工厂方法是一个特殊的方法，用于动态生成并返回实现了函数式接口的类的实例。这个过程通常涉及到字节码的生成和类的加载。
	        generateFactory();
	    }
	
	    /**
		    这行代码通过调用 ClassWriter 的 visitMethod 方法创建了一个新的方法。这个方法的访问级别是 public，方法名是 samMethodName，这是一个从外部传入的参数，表示要实现的SAM接口中的方法名。samMethodType.toMethodDescriptorString() 将方法的签名转换为字符串形式，用于定义方法的参数类型和返回类型。最后两个 null 参数分别表示这个方法的签名和异常，这里不使用这些高级特性，所以传入 null。
		*/
	    MethodVisitor mv = cw.visitMethod(ACC_PUBLIC, samMethodName,
	                                      samMethodType.toMethodDescriptorString(), null, null);
	    // 这行代码给刚才创建的方法添加了一个注解 LambdaForm$Hidden。这个注解是内部使用的，用于标记这个方法不应该被外部调用或者看到。true 参数表示这个注解是在运行时可见的。
	    mv.visitAnnotation("Ljava/lang/invoke/LambdaForm$Hidden;", true);
	    // 这行代码实际上是生成方法体的关键步骤。它创建了一个 ForwardingMethodGenerator 对象，这个对象负责生成方法体的字节码。generate 方法接受一个 MethodType 对象 samMethodType 作为参数，这个对象描述了SAM接口方法的参数类型和返回类型。generate 方法根据这个信息，动态生成字节码，这些字节码实现了将调用转发到实际的目标方法上。
	    new ForwardingMethodGenerator(mv).generate(samMethodType);
	
	
	    /**
			这段代码的主要作用是为了生成桥接方法（Bridge Methods），这些方法用于处理泛型擦除后的类型不匹配问题。在Java中，泛型信息在编译时会被擦除，而桥接方法则用于在运行时保持类型的正确性。这段代码是在动态生成的类中添加这些桥接方法的过程。
	    */
	    // additionalBridges 是一个包含了需要生成桥接方法的 MethodType 对象的数组。
	    if (additionalBridges != null) {
	        for (MethodType mt : additionalBridges) {
	        	// 为每个桥接方法类型生成方法：通过调用 cw.visitMethod 方法生成桥接方法。这里的 cw 是一个 ClassWriter 对象，用于动态生成类的字节码。ACC_PUBLIC|ACC_BRIDGE 是方法的访问标志，表示这是一个公开的桥接方法。samMethodName 是要实现的函数式接口的方法名，mt.toMethodDescriptorString() 将方法类型转换为方法描述符字符串，用于指定方法的签名。
	            mv = cw.visitMethod(ACC_PUBLIC|ACC_BRIDGE, samMethodName,
	                                mt.toMethodDescriptorString(), null, null);
				// 添加方法注解：通过调用 mv.visitAnnotation 方法为生成的桥接方法添加注解。这里的注解是 "Ljava/lang/invoke/LambdaForm$Hidden;"，表示这个方法是由lambda表达式生成的，不应该被直接调用。
	            mv.visitAnnotation("Ljava/lang/invoke/LambdaForm$Hidden;", true);
	            // 生成方法体：通过创建一个新的 ForwardingMethodGenerator 对象并调用其 generate 方法来生成桥接方法的方法体。这个方法体基本上是将调用转发到实际的实现方法上。
	            new ForwardingMethodGenerator(mv).generate(mt);
	        }
	    }
	
		/**
			这段代码的作用是根据是否需要序列化，生成对应的方法。具体来说，如果需要生成的类是可序列化的，则生成序列化友好的方法；如果不是故意的可序列化（即无意中成为可序列化的），则生成序列化敌对的方法。最后，调用 cw.visitEnd() 来完成类的定义。

				1.判断是否需要序列化：通过 if (isSerializable) 判断，如果 isSerializable 为 true，则表示需要生成的类是可序列化的，此时会调用 generateSerializationFriendlyMethods() 方法生成序列化友好的方法。
				2.判断是否无意中成为可序列化：如果 isSerializable 为 false，则进入 else if (accidentallySerializable) 判断，accidentallySerializable 为 true 表示类无意中成为了可序列化的（例如，通过实现了某个可序列化的接口）。此时会调用 generateSerializationHostileMethods() 方法生成序列化敌对的方法，这可能是为了避免序列化带来的潜在问题或性能影响。
				3.完成类的定义：无论是否需要序列化，最后都会执行 cw.visitEnd()，这是ASM库中的方法，用于完成类的定义。这一步是生成类文件的最后一步，标志着类定义的结束。
		*/
	    if (isSerializable)
	        generateSerializationFriendlyMethods();
	    else if (accidentallySerializable)
	        generateSerializationHostileMethods();
	
	    cw.visitEnd();
	
		// 这行代码调用 ClassWriter 对象的 toByteArray 方法，将动态生成的类转换为字节码数组。cw 是 ClassWriter 的实例，它负责生成类的字节码。
	    final byte[] classBytes = cw.toByteArray();
	
		/**
			这段代码首先检查 dumper 对象是否为 null。dumper 是一个可能用于将字节码写入文件的工具对象。如果 dumper 不为 null，则执行以下步骤：
				1.使用 AccessController.doPrivileged 方法执行一个特权操作。这是因为写入文件可能需要特定的权限，特别是在启用了安全管理器的环境中。
				2.在 doPrivileged 方法中，执行一个 PrivilegedAction，其 run 方法调用 dumper.dumpClass 方法，将类名 lambdaClassName 和字节码数组 classBytes 传递给它，以便将字节码写入文件。
				3.doPrivileged 方法的第二个参数是 null，表示不使用特定的 AccessControlContext。
				4.第三和第四个参数是 FilePermission 和 PropertyPermission 对象，分别授予读写所有文件的权限和读取用户当前目录的权限。这些权限是执行文件写入操作所必需的。
		*/
	    // 转储到文件
	    if (dumper != null) {
	        AccessController.doPrivileged(new PrivilegedAction<Void>() {
	            @Override
	            public Void run() {
	                dumper.dumpClass(lambdaClassName, classBytes);
	                return null;
	            }
	        }, null,
	        new FilePermission("<<ALL FILES>>", "read, write"),
	        // 创建目录可能需要它
	        new PropertyPermission("user.dir", "read"));
	    }
	    /**
	    	1.代码的作用
				下面这段代码的作用是在运行时动态定义一个匿名类。UNSAFE.defineAnonymousClass 方法接收三个参数：目标类（targetClass），类的字节码（classBytes），以及与类相关联的常量池补丁（这里传入的是 null）。
			2.代码的结构和逻辑
				2.1 targetClass：这是一个 Class 对象，表示新定义的匿名类将与之关联的上下文。通常，这个类是匿名类逻辑上的“宿主”类。
				2.2 classBytes：这是一个字节数组，包含了新匿名类的字节码。这些字节码通常是通过某种字节码生成库（如ASM）动态生成的。
				2.3 null：这个参数是用于类定义时的常量池补丁，这里传入 null 表示不需要进行常量池的补丁。
			3.关键代码块或语句的解释
				3.1 UNSAFE：这是 sun.misc.Unsafe 类的一个实例。Unsafe 类提供了一组底层、危险的操作，通常不推荐在标准Java代码中使用。但在某些特殊场景下，如动态类生成、低级并发控制等，Unsafe 提供的功能是必需的。
				3.2 .defineAnonymousClass(targetClass, classBytes, null)：这个方法调用是动态定义匿名类的关键。它将 classBytes 中的字节码转换为一个Java类，并将这个新类与 targetClass 关联起来。由于这个类是匿名的，它没有正式的类名。传入的 null 参数表示在定义类的过程中不需要对常量池进行任何补丁操作。
	    */
	
		// 通过 Unsafe 类的 defineAnonymousClass 方法动态定义了一个匿名类，这个类的字节码由 classBytes 提供，而这个匿名类在逻辑上与 targetClass 关联。
	    return UNSAFE.defineAnonymousClass(targetClass, classBytes, null);
	}

四、利用java.lang.invoke.InnerClassLambdaMetafactory#dumper 转储lambda文件

// 静态初始化块，用于初始化dumper
	static {
	    /**
		 * 获取并设置代理类转储功能
		 */
		// 定义系统属性的键名，用于控制是否转储内部lambda代理类
		final String key = "jdk.internal.lambda.dumpProxyClasses";
		
		// 使用AccessController执行特权操作，获取系统属性值
		String path = AccessController.doPrivileged(
		        new GetPropertyAction(key), // 创建获取属性的动作
		        null, // 不指定AccessControlContext
		        new PropertyPermission(key , "read") // 指定所需的权限
		);

		// 根据获取的路径创建ProxyClassesDumper实例
		// 如果路径为null，则不启用转储功能
		dumper = (null == path) ? null : ProxyClassesDumper.getInstance(path);

	}

JVM参数：jdk.internal.lambda.dumpProxyClasses
命令：java -Djdk.internal.lambda.dumpProxyClasses ClassName
转储得到内部类：
反编译：java -jar cfr-0.152.jar LambdaExample.class --decodelambdas false

步骤一：源码

import java.util.Arrays;
import java.util.List;

public class LambdaExample {
    public static void main(String[] args) {
        List<String> items = Arrays.asList("Apple", "Banana", "Cherry");
        items.forEach(item -> System.out.println(item));
    }
}

步骤二：编译，生成LambdaExample.class 文件

javac LambdaExample.java

步骤三：执行java命令，生成文件：LambdaExample$$Lambda$1.class

java -Djdk.internal.lambda.dumpProxyClasses LambdaExample

这个命令是用来调试和分析 Java 中 lambda 表达式的底层实现的。具体解释如下：

-D 参数：
用于设置系统属性。
jdk.internal.lambda.dumpProxyClasses：
这是一个特殊的系统属性，用于指示 JVM 将 lambda 表达式生成的代理类保存到磁盘。
LambdaExample：
这是要运行的包含 lambda 表达式的 Java 类名。

当你运行这个命令时，JVM 会执行以下操作：

运行 LambdaExample 类。
对于该类中的每个 lambda 表达式，JVM 会生成一个代理类。
这些生成的代理类会被保存到磁盘上，通常在当前工作目录下。

这个功能主要用于：

分析 lambda 表达式的底层实现
调试复杂的 lambda 表达式
了解 JVM 如何处理和优化 lambda 表达式

生成的代理类文件名通常遵循这样的模式：
主类名$Lambda$序号.class

步骤四：生成反编译代码：lambda内部类

java -jar cfr-0.152.jar 'LambdaExample$$Lambda$1.class' --decodelambdas false

mac电脑，此处LambdaExample$$Lambda$1.class需要带引号，因为在命令行中，$ 是一个特殊字符，用于引用变量。在这个上下文中，$$ 容易被解释为当前 shell 进程的 PID（进程ID），而不是文件名的一部分。所以你需要用引号将文件名括起来，这样可以防止 shell 解释 $ 字符。

/*
 * Decompiled with CFR 0.152.
 */
import java.lang.invoke.LambdaForm;
import java.util.function.Consumer;

final class LambdaExample$$Lambda$1
implements Consumer {
    private LambdaExample$$Lambda$1() {
    }

    @LambdaForm.Hidden
    public void accept(Object object) {
        LambdaExample.lambda$main$0((String)object);
    }
}

这段代码是由Java编译器为lambda表达式生成的内部类。让我们逐部分解析：

final class LambdaExample$$Lambda$1
- 这是一个自动生成的内部类，名称中的 $$Lambda$1 表示它是为第一个lambda表达式生成的。
- final 关键字表示这个类不能被继承。
implements Consumer
- 这个类实现了 Consumer 接口，这是Java 8引入的函数式接口之一。
private LambdaExample$$Lambda$1()
- 这是一个私有构造函数，防止外部直接实例化这个类。
@LambdaForm.Hidden
- 这是一个内部注解，用于标记这个方法不应该在堆栈跟踪中显示。
public void accept(Object object)
- 这是 Consumer 接口中定义的方法。
- 方法接受一个 Object 类型的参数。
LambdaExample.lambda$main$0((String)object);
- 这行代码调用了 LambdaExample 类中的一个静态方法 lambda$main$0。
- 参数 object 被强制转换为 String 类型。

这个生成的类实际上是lambda表达式的一个"包装器"。它将lambda表达式封装成一个实现了 Consumer 接口的具体类。当lambda表达式被调用时，它会调用 LambdaExample 类中相应的静态方法（在这里是 lambda$main$0）。

这种实现方式允许Java在不使用匿名内部类的情况下支持lambda表达式，从而提高了性能和减少了内存使用。

三、结论

lambda 底层实现机制
1.lambda 表达式的本质：函数式接口的匿名子类的匿名对象
2.lambda表达式是语法糖

语法糖：编码时是lambda简洁的表达式，在字节码期，语法糖会被转换为实际复杂的实现方式，含义不变；即编码表面有个糖衣，在编译期会被脱掉

Lambda表达式的编译及运行过程如下：

在这里插入图片描述

编译阶段

Lambda表达式识别：
- 编译器识别Lambda表达式，将其转换为静态方法。
生成invokedynamic指令：
- 编译器为每个Lambda表达式生成一个invokedynamic指令。
- 指定LambdaMetafactory.metafactory或altMetafactory作为引导方法。
ASM使用：
- 编译器可能使用ASM库生成或修改字节码。

运行阶段

引导方法（Bootstrap Method）调用：
- 当JVM首次遇到某个invokedynamic指令时，它会调用指定的引导方法。对于Lambda表达式，这个引导方法通常是LambdaMetafactory的metafactory方法。
LambdaMetafactory调用：
- 引导方法（通常是LambdaMetafactory.metafactory）被调用。
- 接收参数：MethodHandles.Lookup、函数式接口信息、Lambda方法信息等。
创建CallSite对象：
- 引导方法的任务之一是创建一个CallSite对象。CallSite是一个抽象类，它代表了一个动态方法调用点。它的具体实现类（如ConstantCallSite）封装了对特定方法的调用。
- CallSite对象持有一个MethodHandle，这个MethodHandle指向实际要执行的方法。对于Lambda表达式，这个方法是Lambda表达式转换成的方法。
绑定MethodHandle：
- 在创建CallSite对象时，引导方法会根据Lambda表达式的目标类型和实际代码，构造一个MethodHandle。这个MethodHandle直接指向了包含Lambda表达式代码的方法。
- 然后，这个MethodHandle被绑定到CallSite对象上。这意味着，当通过这个CallSite调用方法时，实际上是通过绑定的MethodHandle来调用Lambda表达式对应的方法。
返回CallSite对象：
- 引导方法返回CallSite对象给JVM。这个CallSite对象随后被用于所有对该invokedynamic指令的调用。
- 由于CallSite对象已经绑定了对应的MethodHandle，因此每次通过这个CallSite调用方法时，都会直接调用到Lambda表达式对应的方法，无需再次解析。
InnerClassLambdaMetafactory使用：
InnerClassLambdaMetafactory用于动态生成实现函数式接口的类。这个过程主要通过spinInnerClass方法实现。
spinInnerClass方法
spinInnerClass方法的主要任务是动态生成一个类，这个类实现了指定的函数式接口，并包含了Lambda表达式的代码。这个方法通过直接操作字节码来创建类，通常使用ASM库来完成。
使用Unsafe生成匿名类
spinInnerClass方法可能会通过Unsafe类的功能来加载生成的字节码。Unsafe是JDK内部的一个类，提供了一些底层操作，比如直接内存访问、线程调度等。其中，Unsafe.defineAnonymousClass方法可以用来加载一个类的字节码，并返回这个类的Class对象。这个方法允许动态生成的类没有对应的.class文件。
生成匿名类的过程
1. 生成字节码：
  - spinInnerClass方法使用ASM库生成实现了函数式接口的类的字节码。这个类包含了Lambda表达式的实现代码。
2. 加载类：
  - 使用Unsafe.defineAnonymousClass方法加载生成的字节码。这个方法接受三个参数：父类的Class对象、字节码数组、以及与类相关的常量池补丁。这个方法返回新加载的类的Class对象。
3. 实例化：
  - 通过反射或其他机制，使用返回的Class对象创建实例。这个实例实现了指定的函数式接口，并包含了Lambda表达式的代码。
绑定到CallSite：
- 创建一个MethodHandle，指向新生成的类的实例方法。这个MethodHandle随后被绑定到CallSite对象上，用于后续的方法调用。

注意

Unsafe类的使用通常不推荐，因为它提供了很多强大但危险的底层操作。在JDK 9及以后版本中，Unsafe类的一些功能被限制或替换，以促进更安全的编程实践。
JDK的具体实现细节可能会随着版本变化。上述过程主要描述了一种通过Unsafe加载动态生成类的方法，但实际的实现可能会有所不同。