1.火焰图
火焰图整个图形看起来就像一团跳动的火焰, 这也正是其名字的由来. 燃烧在火苗尖部的就是 CPU 正在执行的操作, 不过需要说明的是颜色是随机的, 本身并没有特殊的含义, 纵向表示调用栈的深度, 横向表示消耗的时间。因为调用栈在横向会按照字母排序, 并且同样的调用栈会做合并, 所以一个格子的宽度越大越说明其可能是瓶颈。综上所述, 主要就是看那些比较宽大的火苗, 特别留意那些类似平顶山的火苗。
2. perf命令生成火焰图
perf命令是 Linux 系统原生提供的性能分析工具,会返回 CPU 正在执行的函数名以及调用栈(stack)。通常,它的执行频率是 99Hz(每秒99次),如果99次都返回同一个函数名,那就说明 CPU 这一秒钟都在执行同一个函数,可能存在性能问题。
Perf命令生成火焰图的操作步骤如下:
2.1找出应用程序或内核消耗CPU的PID
命令窗口下输入top,结果如下,我们以media为例,其pid为27867。
2.2 执行perf record 命令,记录该PID的行为
命令行输入:perf record -a -g -p 27867 -- sleep 60,其中:
-g 选项是告诉perf record额外记录函数的调用关系
-a 表示对所有CPU采样
-p 指定需要record的进程pid
-- sleep 60表示60秒后退出
60秒后,在当前目录下会生成一个perf.data文件
2.3 perf report命令
perf report –i perf.data命令可以统计每个调用栈出现的百分比, 然后从高到低排列。按上下方向键以及回车键,展开比例最高的函数后,你就可以得到下面这个调用关系链图:
2.4 火焰图分析
perf record生成的结果不易阅读,所以才有了火焰图。火焰图是基于 perf 结果产生的 SVG 图片,用来展示 CPU 的调用栈。能从 perf record 记录生成火焰图的工具可以通过
git clone https://github.com/brendangregg/FlameGraph来获取。下载后工具后,使用命令cd FlameGraph/切换到工具目录下,执行下面的命令,就可以直接生成火焰图:
perf script -i ../perf.data | ./stackcollapse-perf.pl --all | ./flamegraph.pl > ksoftirqd.svg
执行成功后,使用浏览器打开 ksoftirqd.svg ,你就可以看到生成的火焰图了。如下图所示:
y 轴表示调用栈,每一层都是一个函数。调用栈越深,火焰就越高,顶部就是正在执行的函数,下方都是它的父函数。x 轴表示抽样数,如果一个函数在 x 轴占据的宽度越宽,就表示它被抽到的次数多,即执行的时间长。注意,x 轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。
火焰图就是看顶层的哪个函数占据的宽度最大。只要有"平顶"(plateaus),就表示该函数可能存在性能问题。颜色没有特殊含义,因为火焰图表示的是 CPU 的繁忙程度,所以一般选择暖色调。
火焰图是 SVG 图片,可以与用户互动。
(1)鼠标悬浮
火焰的每一层都会标注函数名,鼠标悬浮时会显示完整的函数名、抽样抽中的次数、占据总抽样次数的百分比。
(2)点击放大
在某一层点击,火焰图会水平放大,该层会占据所有宽度,显示详细信息。左上角会同时显示"Reset Zoom",点击该链接,图片就会恢复原样。
(3)搜索
按下 Ctrl + F 会显示一个搜索框,用户可以输入关键词或正则表达式,所有符合条件的函数名会高亮显示