性能优化 - 案例篇：JIT-CSDN博客

本文链接：https://blog.csdn.net/yangshangwei/article/details/148519444

在这里插入图片描述

Java 虚拟机栈的“栈帧＋操作数栈”模型虽能保证跨平台，但解释执行开销巨大。JIT（Just-In-Time 编译器）正是为了解决这类热点路径上的性能瓶颈：将反复执行的字节码动态编译为本地机器码，并在运行时做多种优化，从而显著提升吞吐与响应速度。

在这里插入图片描述

原理：将短小方法体直接“拷贝”到调用处，省去一次调用/返回过渡，减少栈帧创建，降低指令跳转。
Java 参数：
- -XX:+Inline/-XX:-Inline 启用或禁用内联。
- -XX:CompileCommand=exclude,类名.方法名 精细排除。
注解控制：@ForceInline 强制内联，@DontInline 禁止内联。
案例（JMH Benchmark）：
```
baseline    ≈0.48 ns/op
dontInline  ≈1.93 ns/op
exclude     ≈57.6 ns/op
inline      ≈0.48 ns/op
```
内联后比不内联快约 5 倍；整体 JIT 与解释执行差距可达数百倍。

在这里插入图片描述

即时编译器：HotSpot 提供 C1（客户端）和 C2（服务器），JDK10+ 可选 Graal。
分层编译流程：
1. 解释执行字节码；
2. C1 无 profiling 执行；
3. C1 部分 profiling（方法/循环计数）；
4. C1 全 profiling；
5. C2 优化执行。
触发阈值：-XX:CompileThreshold，分层编译时失效，改用动态自适应策略。
后台编译：C1/C2 线程与业务线程并行，不阻塞解释执行。

逃逸分析：JIT 通过 -XX:+DoEscapeAnalysis（默认开启）判断对象是否“逃出”方法或线程。
- 场景：赋值给字段/静态变量、通过 return 返回即视为逃逸。
优化手段：
1. 栈上分配：对“未逃逸对象”直接在栈帧分配，减少堆分配与 GC 压力；
2. 标量替换：将对象拆解为基本类型局部变量；
3. 同步消除：对仅限单线程访问的 synchronized 区块可去除，需 -XX:+EliminateLocks。

示例：

public Object test() {
    Object obj = new Object(); // 若未逃逸，可栈上分配
    return obj;                // 返回即逃逸，不优化
}

安装与日志

-XX:+UnlockDiagnosticVMOptions -XX:+LogCompilation -XX:LogFile=jitdemo.log

在这里插入图片描述