perf工具使用
安装
sudo apt install linux-tools-common -y
# 不同内核可能不同
sudo apt install linux-tools-5.4.0-113-generic linux-cloud-tools-5.4.0-113-generic -y
使用
列出所有能触发perf
采样点的事件
sudo perf list
通过概括精简的方式提供被调试程序运行的整体情况和汇总数据
sudo perf stat ./demo
ask-clock-msecs:CPU 利用率,该值高,说明程序的多数时间花费在 CPU 计算上而非 IO。
Context-switches:进程切换次数,记录了程序运行过程中发生了多少次进程切换,频繁的进程切换是应该避免的。
Cache-misses:程序运行过程中总体的 cache 利用情况,如果该值过高,说明程序的 cache 利用不好
CPU-migrations:表示进程 t1 运行过程中发生了多少次 CPU 迁移,即被调度器从一个 CPU 转移到另外一个 CPU 上运行。
Cycles:处理器时钟,一条机器指令可能需要多个 cycles,
Instructions: 机器指令数目。
IPC:是 Instructions/Cycles 的比值,该值越大越好,说明程序充分利用了处理器的特性。
Cache-references: cache 命中的次数
Cache-misses: cache 失效的次数。
注:通过指定 -e 选项,您可以改变 perf stat 的缺省事件
实时显示当前系统性能统计信息
sudo perf top
记录单个函数级别的统计信息,perf record
记录单个函数级别的统计信息,perf report
显示统计结果
sudo perf record -e cpu-clock ./demo
sudo perf report
# 使用-g参数可以查看具体某个函数所花费的时间以及函数的调用路径
如果想关心perf
的具体某个事件,希望按某个事件来进行统计则可以通过-e
来指定某个事件
sudo perf stat -e raw_syscalls:sys_enter ls
动态的在想查看的地方插入动态监测点
sudo perf probe schedule:12 cpu
# 上例利用 probe 命令在内核函数 schedule() 的第 12 行处加入了一个动态 probe 点,和 tracepoint 的功能一样,内核一旦运行到该 probe 点时,便会通知 perf。可以理解为动态增加了一个新的 tracepoint
分析内核工具来分析内核CPU调度器的行为
sudo perf sched record sleep 10
sudo perf sched latency --sort max