Thank Zhihao Tao for your hard work. The document spent countless nights and weekends, using his hard work to make it convenient for everyone.
If you have any questions, please send a email to zhihao.tao@outlook.com
1. 概述
火焰图是性能分析的利器,可以快速,准确地识别出最频繁的代码路径。
- 官方资料: http://www.brendangregg.com/flamegraphs.html
- git地址: https://github.com/brendangregg/FlameGraph
- 春哥的systemtap
- Linux下用火焰图进行性能分析
- 示例
http://www.brendangregg.com/FlameGraphs/cpu-bash-flamegraph.svg
2. 创建火焰图
创建火焰图需要如下3个步骤:
- 捕获堆栈
- 折叠堆栈
- 生成火焰图
2.1 捕获堆栈
可以使用Linux perf_events、FreeBSD pmcstat(hwpmc)、DTrace、SystemTap和许多其他探查器来捕获堆栈示例。例如:
# https://github.com/brendangregg/FlameGraph
stackcollapse-aix.pl
stackcollapse-bpftrace.pl
stackcollapse-elfutils.pl
stackcollapse-gdb.pl
stackcollapse-go.pl
stackcollapse-instruments.pl
stackcollapse-java-exceptions.pl
stackcollapse-jstack.pl
stackcollapse-ljp.awk
stackcollapse-perf.pl
stackcollapse-perf-sched.awk
stackcollapse-pmc.pl
stackcollapse-recursive.pl
stackcollapse-sample.awk
stackcollapse-stap.pl
stackcollapse-vsprof.pl
stackcollapse-vtune.pl
stackcollapse-xdebug.php
stackcollapse | 描述 |
---|---|
stackcollapse.pl | DTrace stacks |
stackcollapse-perf.pl | Linux perf_events |
stackcollapse-pmc.pl | FreeBSD pmcstat -G stacks |
stackcollapse-stap.pl | SystemTap stacks |
stackcollapse-instruments.pl | XCode Instruments |
stackcollapse-vtune.pl | Intel VTune profiles |
stackcollapse-ljp.awk | Lightweight Java Profiler |
stackcollapse-jstack.pl | Java jstack |
stackcollapse-gdb.pl | gdb stacks |
stackcollapse-go.pl | Golang pprof stacks |
stackcollapse-vsprof.pl | Microsoft Visual Studio profiles |
2.1.1 Linux perf_events
使用Linux perf_events(别名perf,performance的缩写)示例。
-a、 --所有CPU
来自所有CPU的系统范围的集合(如果未指定目标,则为默认值)。
通过添加–inherit来启用它。
perf参数 | 描述 |
---|---|
record | 允许一条命令记录他的概述到perf.data 。 |
script | 读取perf.data 并显示其跟踪输出。 |
-F ,--freq= | 采样频率 |
-a ,--all-cpus | 来自所有CPU的系统范围的集合(如果未指定目标,则为默认值)。 |
-g | 记录调用栈 |
-p ,--pid= | 在现有进程ID(逗号分隔列表)上记录事件。 |
-t ,--tid= | 记录现有线程ID(逗号分隔列表)上的事件。 |
- 示例一
# perf record -F 99 -a -g -- sleep 60
# perf script > out.perf
- 示例二
perf record -F 99 -p 181 -g -- sleep 60
perf script > out.perf
2.2 折叠堆栈
使用stackcollapse
程序将堆栈折叠。
./stackcollapse-perf.pl out.perf > out.folded
2.3 生成火焰图
使用flamegraph.pl
生成火焰图。
./flamegraph.pl perf.folded > perf.svg
3. 解析火焰图
-
y轴
表示调用栈,每一层都是一个函数。调用栈越深,火焰就越高,顶部就是正在执行的函数,下方都是它的父函数。 -
x轴
表示抽样数,如果一个函数在x轴占据的宽度越宽,就表示它被抽到的次数多,即执行的时间长。注意,x轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。
火焰图就是看顶层的哪个函数占据的宽度最大。只要有"平顶"(plateaus),就表示该函数可能存在性能问题。