使用perf生成火焰图
前置准备,下载perf,使用perf生成perf.data
1.下载perf
sudo apt install linux-tools-common
运行perf,根据提示下载,sudo apt install linux-tools-5.4.0-150-generic
2.编写测试程序
perf_example.c
#include <stdio.h>
void perform_computation() {
int i;
double result = 0.0;
// 计算密集型循环
for (i = 1; i <= 1000000; ++i) {
result += (double)i / (double)(i + 1);
}
// 打印结果以防止循环被优化掉
printf("Result: %lf\n", result);
}
int main() {
perform_computation();
return 0;
}
生成可执行程序perf_example
gcc -o perf_example perf_example.c
3.使用perf生成perf.data
perf record -g ./perf_example
- -g:该选项记录调用图信息,即捕获采样时程序的调用堆栈。这个参数最好加上,不然后面生成火焰图时容易出现ERROR:No stack counts found
- 此步骤之后也可以使用perf report输出采样结果。
生成火焰图
(1)下载FlameGraph,将其与perf.data放到统一文件夹下
git clone https://github.com/brendangregg/FlameGraph.git
(2)生成折叠后的调用栈
perf script -i perf.data &> perf.unfold
(3)将解析出来的信息存下来, 供生成火焰图,首先用 stackcollapse-perf.pl 将 perf 解析出的内容 perf.unfold 中的符号进行折叠
./FlameGraph/stackcollapse-perf.pl perf.unfold &>perf.folded
(4)最后生成 svg 图
./FlameGraph/flamegraph.pl perf.folded > perf.svg
我们可以使用管道将上面的流程简化为一条命令
perf script | FlameGraph/stackcollapse-perf.pl |FlameGraph/flamegraph.pl > process.svg
火焰图含义
- 火焰图是基于 stack 信息生成的 SVG 图片, 用来展示 CPU 的调用栈。
- y 轴表示调用栈, 每一层都是一个函数. 调用栈越深, 火焰就越高, 顶部就是正在执行的函数, 下方都是它的父函数.
- x 轴表示抽样数, 如果一个函数在 x 轴占据的宽度越宽, 就表示它被抽到的次数多, 即执行的时间长. 注意, x 轴不代表时间, 而是所有的调用栈合并后, 按字母顺序排列的.
- 火焰图就是看顶层的哪个函数占据的宽度最大. 只要有 “平顶”(plateaus), 就表示该函数可能存在性能问题。
- 颜色没有特殊含义, 因为火焰图表示的是 CPU 的繁忙程度, 所以一般选择暖色调.
查看火焰图
- 用浏览器打开SVG图片,可以查看详细信息
- 鼠标悬浮
火焰的每一层都会标注函数名, 鼠标悬浮时会显示完整的函数名、抽样抽中的次数、占据总抽样次数的百分比。 - 点击放大
在某一层点击,火焰图会水平放大,该层会占据所有宽度,显示详细信息。
左上角会同时显示 “Reset Zoom”, 点击该链接, 图片就会恢复原样. - 搜索
按下 Ctrl + F 会显示一个搜索框,用户可以输入关键词或正则表达式,所有符合条件的函数名会高亮显示.