perf性能分析

qq_40178082

已于 2025-01-02 21:51:16 修改

阅读量1.1k

点赞数 32

分类专栏：性能分析文章标签： c++

于 2025-01-02 21:43:08 首次发布

本文链接：https://blog.csdn.net/qq_40178082/article/details/144894723

版权

性能分析专栏收录该内容

1 篇文章

订阅专栏

一、perf安装

1.安装perf

# Ubuntu系统
sudo apt-get install linux-tools-common linux-tools-generic linux-tools-`uname -r`
# Centos系统
yum install -y perf

2.查看perf版本

$ perf --version
perf version 5.4.44

3.perl和FlameGraph安装

利用这个开源工具可以将报告生成可视化的svg图片，更容易查看对应的CPU开销时间和调用栈深度。

git clone --depth 1 https://github.com/brendangregg/FlameGraph.git
# 安装perl
yum install -y perl
# Ubuntu
apt install  -y perl

二、快速上手指南

1.perf指令详解

让我们从 perf 命令（performance 的缩写）讲起，它是 Linux 系统原生提供的性能分析工具，会返回 CPU 正在执行的函数名以及调用栈（stack）。

通常，它的执行频率是 99Hz（每秒99次），如果99次都返回同一个函数名，那就说明 CPU 这一秒钟都在执行同一个函数，可能存在性能问题。

sudo perf record -F 99 -p 13204 -g -- sleep 30

上面的代码中，perf record表示记录，-F 99表示每秒99次，-p 13204是进程号，即对哪个进程进行分析，-g表示记录调用栈，sleep 30则是持续30秒。

运行后会产生一个庞大的文本文件。如果一台服务器有16个 CPU，每秒抽样99次，持续30秒，就得到 47,520 个调用栈，长达几十万甚至上百万行。

2.测试代码

#include <stdio.h>
#include <stdlib.h>

void long_test() {
    int i, j;
    for (i = 0; i < 1000000; i++) j = i;
}

void long_test2() {
    int i, j;
    for (i = 0; i < 10000; i++) j = i;
}


void foo2() {
    int i;
    for (i = 0; i < 1000; i++) long_test2();
}

void foo1() {
    int i;
    for (i = 0; i < 1000; i++) long_test();
}
int main(void) {
    foo1();
    foo2();
}

3.使用perf对系统CPU事件做采样

采样60s，会生成一个perf.data文件。

# 方式一：对一个正在运行的进程，进行采样
perf record -p PID -g -- sleep 60
# 方式二：全新运行一个二进制文件main，进行采样
sudo perf record -F 99 -g ./test -- sleep 60

4.打印调用栈

为了便于阅读，perf record命令可以统计每个调用栈出现的百分比，然后从高到低排列。

sudo perf report -n --stdio

5.生成火焰图

生成火焰图的脚本
对二进制文件main进行10秒的采样，然后生成火焰图
非root用户需要加sudo

perf script -i perf.data &> perf.unfold
./FlameGraph/stackcollapse-perf.pl perf.unfold &> perf.folded
./FlameGraph/flamegraph.pl perf.folded > perf.svg

在浏览器中打开