JVM 如何使用性能分析工具定位代码中的性能问题？-CSDN博客

本文链接：https://blog.csdn.net/nmsoftklb/article/details/147635725

核心思想： 通过工具观察程序在特定负载下的运行状态，识别消耗资源最多的代码段（热点代码）、异常的内存分配模式或线程阻塞情况，然后针对性的优化代码。

通用步骤：

确定问题： 首先明确遇到了什么性能问题，例如：CPU 使用率过高、内存持续增长最终 OOM、响应时间突然变慢、吞吐量下降等。
选择工具： 根据问题的类型和你的环境选择合适的性能分析工具。
连接或启动分析： 将工具连接到目标 JVM 进程，或者启动带有特定分析功能的 JVM。
施加负载： 模拟实际的用户负载，让问题得以重现。
收集数据： 在负载持续期间，使用工具收集性能数据（CPU 采样、内存快照、线程转储等）。
分析数据： 使用工具提供的分析功能，解读收集到的数据。
定位代码： 根据分析结果，确定具体是哪个类、哪个方法、哪行代码导致了性能问题。
优化代码： 针对定位到的问题代码进行优化。
验证效果： 重新运行负载测试，验证优化是否解决了问题并达到了性能目标。

常用工具及其定位代码问题的方法：

jstack (线程堆栈分析)
- 作用： 获取 JVM 中所有线程的堆栈信息。主要用于分析线程阻塞、死锁、以及线程在做什么（例如是否在等待 I/O、等待锁）。
- 定位代码问题：
  - 高 CPU 但堆栈显示大量 WAITING/TIMED_WAITING： 可能线程在等待某个条件或锁，但等待时间过长。查看这些线程的堆栈，能看到它们在哪个方法、哪个锁上等待。
  - 大量 BLOCKED 状态线程： 表明存在严重的锁竞争。查看这些 BLOCKED 线程的堆栈，以及它们试图获取的锁（“waiting for monitor…”），再看拥有这个锁的线程（“owned by…”）在做什么。这能帮助我们定位竞争锁的同步代码块。
  - 死锁： jstack 会在最后输出明确报告，可以帮助我们发现死锁，并列出涉及的线程和锁。
  - 线程长时间停留在某个方法： 如果看到很多线程的堆栈顶部停留在某个特定方法，并且状态不是 BLOCKED/WAITING，可能这个方法本身执行缓慢。
- 使用方法： jstack <pid> (pid 是 Java 进程 ID)。可以多次采集（例如每隔几秒采集一次），以便观察线程状态的变化。
jmap (内存分析 - 堆转储)
- 作用： 生成 JVM 堆内存的快照（Heap Dump），或者打印堆内存的统计信息。主要用于分析内存使用情况、查找内存泄漏。
- 定位代码问题：
  - 内存泄漏： 生成堆转储文件 (jmap -dump:format=b,file=heap.bin <pid>) 后，使用 Eclipse MAT (Memory Analyzer Tool) 或 VisualVM 的 HeapWalker 打开分析。这些工具可以计算对象的“保留大小”（即该对象被垃圾回收后能释放的总内存），列出按保留大小排序的对象，找出最大的对象集合。通过分析对象的引用链（Paths To GC Roots），可以找到为什么这些对象没有被回收，通常能定位到是哪个类、哪个静态变量、哪个集合等持有了不必要的引用。
  - 对象创建率过高/大对象： 分析堆转储也能看到各种对象的实例数量和总大小。如果某个类的对象数量异常庞大，或者有些对象占用了大量内存，我们需要检查创建这些对象的代码。虽然 jmap 本身不提供创建时机的追踪，但结合代码逻辑分析堆内容，可以回溯到创建点。
- 使用方法： jmap -dump:format=b,file=/path/to/heap.hprof <pid>。分析 .hprof 文件通常需要专业的 GUI 工具。
jstat (JVM 统计监控)
- 作用： 监控 JVM 的各种运行时统计信息，如 GC 情况、堆内存使用、类加载等。
- 定位代码问题：
  - GC 频繁或停顿长： jstat -gc <pid> <interval> <count> 可以实时输出 Young GC (YGC) 和 Full GC (FGC) 的次数和耗时。如果 YGC 次数非常多，或者 FGC 频繁且耗时很长，说明内存分配和回收是瓶颈。这本身不直接指向代码，但它指示我们需要关注代码中的对象创建行为和内存使用模式。频繁的 YGC 可能意味着新生代太小或对象创建速度太快；频繁 FGC 可能意味着老年代满得快，需要检查是否有大量对象晋升或存在内存泄漏。
- 使用方法： jstat -gc <pid> 2s 10 (每 2 秒输出一次，共 10 次)。
VisualVM (集成工具)
- 作用： 一个免费的、集成的可视化工具，可以监控 CPU、内存、线程，并进行 CPU 和内存分析（Profiling）。支持插件扩展。
- 定位代码问题：
  - CPU 性能分析 (Profiler -> CPU): 这是 VisualVM 定位 CPU 热点代码的主要功能。它可以通过采样（Sampling）或插桩（Instrumentation）两种方式记录方法调用的耗时。运行 CPU Profiler 一段时间后，它会列出消耗 CPU 时间最多的方法列表（按百分比排序）。点击具体方法，可以查看它的调用者（Callers）和被调用者（Callees），以及完整的调用树（Call Tree）。通过分析调用树，可以精确地找到是哪个方法（及其调用路径）占用了大量的 CPU 时间。
  - 内存性能分析 (Profiler -> Memory): 可以记录一段时间内的对象创建情况，显示哪些类创建的对象最多，以及它们占用的内存。结合 Heap Dump 功能（Monitor -> Heap Dump），进行内存泄漏分析（与 MAT 功能类似，查找大对象和引用链）。
  - 线程分析 (Threads): 提供实时的线程状态视图，可以方便地看到 BLOCKED, WAITING, RUNNABLE 状态的线程数量，并可以一键生成线程转储进行分析（类似于 jstack，但可视化）。
- 使用方法： 启动 VisualVM，连接到本地或远程的 Java 进程。
JMC (Java Mission Control) / JFR (Java Flight Recorder)
- 作用： Oracle 官方推荐的强大工具集。JFR 以极低的开销收集 JVM 和应用程序的事件数据（包括 GC、线程活动、I/O、锁、JIT 编译、方法执行等）。JMC 用于打开并分析 JFR 记录文件。
- 定位代码问题：
  - CPU 热点： JFR 记录的方法采样事件能精确地展示哪些方法在 CPU 上运行时间最长，JMC 提供火焰图（Flame Graph）或树状图等多种视图来分析 CPU 采样数据，非常直观地找到热点方法及其调用链。
  - 锁竞争： JFR 会记录线程等待锁的事件，JMC 的 Lock Analysis 视图能清晰地显示哪些锁竞争最激烈，哪些线程等待时间最长，以及发生在哪个类的哪个方法中。
  - I/O 瓶颈： JFR 记录文件 I/O、Socket I/O 等事件，可以定位代码中低效的 I/O 操作。
  - GC 瓶颈： JFR 详细记录 GC 事件，JMC 提供丰富的 GC 分析视图，结合 CPU 使用率分析，能确定 GC 是否是导致高 CPU 的原因，以及哪些代码行为（如大量对象创建）导致了 GC 压力。
  - 异常与错误： JFR 记录异常抛出事件，能帮你找到代码中频繁发生异常的位置（即使异常被捕获）。
- 使用方法：
  - 启动 JFR recording： 使用 jcmd <pid> JFR.start ... 或在 JVM 启动参数中设置 -XX:+UnlockCommercialFeatures -XX:+FlightRecorder (对于旧版本 Oracle JDK) 或 -XX:StartFlightRecording=... (对于 OpenJDK)。
  - 生成 JFR 文件： 使用 jcmd <pid> JFR.dump ... 或在 recording 结束时自动生成。
  - 分析： 启动 JMC，打开生成的 .jfr 文件进行分析。
Async-Profiler
- 作用： 一个采样式的低开销性能分析工具，支持分析 CPU、堆分配、锁竞争、I/O 等。可以直接 attach 到正在运行的 JVM。
- 定位代码问题： 提供火焰图、树状图等多种输出格式，能快速准确地定位 CPU 热点、高内存分配点、锁竞争发生的代码位置，对 C/C++ 代码和 JVM 内部活动也有很好的支持。
- 使用方法： 作为一个 native 库加载或通过 async-profiler.sh 脚本运行。例如 async-profiler.sh start <pid> -e cpu -f profile.html。

定位代码问题时的技巧：

结合多种工具： 通常不会只使用一个工具。例如，先用 jstat 或 VisualVM 监控 GC 和 CPU 趋势，发现问题后，用 jstack 分析线程状态，用 VisualVM 或 JMC/JFR 进行 CPU/Memory Profiling，如果怀疑内存泄漏则使用 jmap/MAT 分析堆转储。
关注热点： 性能分析工具通常会列出消耗资源最多的前 N 个方法或类。优先分析这些“热点”。
分析调用树/引用链： 不要只看单个方法消耗的时间或单个类占用的内存，更重要的是理解它是如何被调用的（调用树）或为什么没有被回收（引用链）。这能帮助你找到问题的源头。
多点采样： 对于线程分析 (jstack) 或某些 Profiling 工具，采集单次数据可能不够，需要间隔一定时间多次采集，观察状态的变化。
理解工具的工作原理： 知道工具是采样式还是插桩式，以及其开销，有助于更准确地使用和解读结果。
联系代码逻辑： 分析结果最终需要回到代码层面。结合应用的业务逻辑和代码实现，我们要理解为什么这段代码会成为瓶颈。
环境一致性： 尽量在与生产环境相似的环境中进行性能分析。