33.perf工具使用


欢迎访问个人网络日志🌹🌹知行空间🌹🌹


基本介绍

Perf(Performance Counters for Linux,性能计数器子系统)是一个Linux性能分析工具,用于分析系统和应用程序的运行时性能。这个工具位于 Linux 内核源代码树中,具体位置在 tools/perf 目录下。虽然它是一个用户空间的应用程序,但却是唯一一个被包含在 Linux 内核源码中的复杂用户软件。

Perf可以帮助开发人员和系统管理员进行函数级和指令级的热点查找,可以用来分析程序中热点函数的CPU占用率,了解CPU性能计数器、内核跟踪点和硬件事件等信息,从而找到性能瓶颈,优化软件性能并诊断问题。

通过 perf 命令,我们可以获得系统在运行过程中的各种性能数据,例如 CPU 利用率、内存使用情况、磁盘 I/O 等。perf 可以用于多个方面的性能分析,以下是一些常用的用途:

  • CPU 性能分析,通过 perf命令,可以监测 CPU 的使用率、上下文切换次数、缓存命中率等指标,可以帮助开发者找出 CPU 性能瓶颈,优化程序的运行效率。
  • 内存性能分析perf 命令可以监测内存的使用情况,例如内存泄漏、内存碎片等问题,可以帮助开发者优化内存的管理,提高系统的稳定性。
  • 函数级别采样perf可以对程序进行函数级别的采样,从而了解程序的性能瓶颈在哪里。其基本原理是每隔一个固定时间,CPU 会产生一个中断,记录当前是哪个进程、哪个函数,然后给对应的进程和函数加一个统计值,从而知道 CPU 在某个进程或某个函数上花费了多少时间。

如果系统没有安装Perf,安装方式为:

sudo apt install linux-tools-common linux-tools-generic

查看是否安装成功:

perf --version
# perf version 5.15.148

权限设置,默认运行perf命令需要sudo权限,可以通过修改/etc/sysctt.conf文件进行设置

sudo vi /etc/sysctl.conf
# add line
kernel.perf_event_paranoid = 0

perf命令使用

命令格式为:

perf <options> subcommand <options/arguments>

perf支持很多subcommand选项,常用的子命令有:

  • annotate读取perf.data,展示带注释代码,实际使用发现展示的汇编代码
sudo perf annotate -f

# Percent│       xor    %r15d,%r15d
#        │       lea    0x9(%rsp),%rbp
#        │       testb  $0x3,0x90(%rsp)
#        │     ↓ je     96
#        │       swapgs
#        │       nop
#        │       xchg   %ax,%ax
#        │       mov    %cr3,%rax
#        │       bts    $0x3f,%rax
#        │       and    $0xffffffffffffe7ff,%rax
#        │       mov    %rax,%cr3
#        │       xchg   %ax,%ax
#        │       mov    $0x48,%ecx
  • list,展示perf命令可以用来评估程序性能的事件
sudo perf list -h

# Usage: perf list [<options>] [hw|sw|cache|tracepoint|pmu|sdt|metric|metricgroup|event_glob]

通过上面的命令可以查看事件类型,hwhardware硬件相关事件,PMUPerformance Monitoring Unit相关事件等

  • record,记录程序运行时的数据
sudo perf record -e cpu-clock -aR sleep 10

# [ perf record: Woken up 1 times to write data ]
# [ perf record: Captured and wrote 0.002 MB perf.data (~150 samples) ]
  • report,展示perf命令记录的数据
sudo perf report -i perf.data
  • stat查看具体某个事件相关的统计结果
sudo perf stat -e cpu-clock -aR sleep 10

#  Performance counter stats for 'sleep 10':

#               1.13 msec cpu-clock                 #    0.000 CPUs utilized          

#       10.002228914 seconds time elapsed

#        0.001793000 seconds user
#        0.000000000 seconds sys

statrecord子命令的主要区别是record会将结果保存到perf.data文件中,而stat是直接展示结果。

  • top是直接展示整个系统的CPU内存等使用情况
  • script读取perf.data数据,并展示迹输出trace out
子命令作用
annotate汇编代码及注释
list查看所有事件
stat查看某事件相关的性能数据
record录制某事件相关的性能数据,并保存perf.data文件
report加载perf.data文件
top系统相关的性能数据
scriptperf.data相关的trace out

使用perf命令追踪一个正在运行的进程:

sudo perf stat --pid <pid>

reference

1.https://phoenixnap.com/kb/linux-perf#:~:text=The%20Linux%20perf%20tool%20is,and%20analyzing%20CPU%20event%20data.
2.https://cloud.tencent.com/developer/article/2228048

Linux使用perf工具可以通过以下步骤进行操作。首先,根据内核版本进行安装,可以使用包管理工具进行安装,比如在Ubuntu下可以使用命令"apt-get install linux-tools-"$(uname -r)""进行安装。\[1\]如果无法使用包管理工具安装,可以手工编译安装perf工具。首先获取内核版本,使用命令"uname -a",然后在Linux内核托管的网站上找到对应的内核源码进行下载和解压。进入解压后的目录中的tools/perf目录,执行make命令进行编译。编译完成后,在该目录下会生成perf的二进制文件,即我们需要的perf工具。\[1\]需要注意的是,编译过程中可能会出现依赖库的问题,可以根据编译时的提示安装缺少的依赖包,然后重新编译即可获得全功能的perf工具。如果在使用perf工具时看不到调用的函数,说明编译的依赖不全,可以安装依赖包后重新编译。\[1\] 使用perf工具记录进程的CPU使用情况可以通过以下步骤进行操作。首先使用"perf record"命令记录进程的CPU使用情况,可以指定事件和进程ID,例如"sudo perf record -e cpu-clock -g -p 20000"。然后使用"perf script"工具perf.data进行解析,可以将解析结果输出到文件中,例如"sudo perf script -i perf.data > perf.unfold"。接下来可以使用Flame Graph工具perf.unfold中的符号折叠,生成脚本文件,例如"sudo FlameGraph/stackcollapse-perf.pl perf.unfold > perf.folded"。最后使用Flame Graph工具perf.folded生成SVG火焰图,可以下载到本地并用浏览器打开,例如"sudo FlameGraph/flamegraph.pl perf.folded > perf.svg"。\[2\] 如果希望在Linux中永久修改perf工具的配置,使其在重启后仍然有效,可以编辑/etc/sysctl.conf文件,在文件末尾加上以下配置: kernel.kptr_restrict=0 kernel.perf_event_paranoid=-1 这样可以禁用内核的一些限制,使perf工具的功能更加完整。\[3\] #### 引用[.reference_title] - *1* [在linux环境中安装perf工具,用于性能分析](https://blog.csdn.net/ghostlv/article/details/125305732)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [linux 性能分析工具perf](https://blog.csdn.net/tian830937/article/details/127722852)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [linux安装perf工具](https://blog.csdn.net/fadai1993/article/details/127324033)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值