Linux中perf工具的使用

通常在程序遇到效能问题时,我们想找到到底哪些API在费时间并以此来分析效能问题,现存有很多工具可以得到这些数据,例如oprofile, perf, DTrace,但这些工具产生的分析数据都不是特别直观,本文主要是说明如何使用perf获取这些数据并生成可视化的图形帮助直观的进行分析.

Perf

Perf 是用来进行软件性能分析的工具,一般发行版本的linux可以直接安装perf,对于嵌入式系统需要自己编译

ubuntu系统中perf安装命令

sudo apt install linux-tools-common 
#与具体的内核版本相关
sudo apt install linux-tools-5.4.0-192-generic linux-cloud-tools-5.4.0-192-generic

使用

抓取记录,perf record表示记录,-F 99表示每秒99次采样,-p 1336 是针对哪个进程进行抓取,-g表示记录调用栈,sleep 10则是持续10秒。

注意要使用root权限运行perf,否则会出现crash.

perf record -F 99 -p 1336 -g -- sleep 10

也可以使用下面命令抓取所有进程

perf record -F 99 -a -g -- sleep 10

抓取完后会产生一个perf.data文件,用下面命令将其转化为可被直接读懂的callstack信息文件 out.perf

perf script > out.perf

火焰图

其实一般的情况下使用下面命令也能够看到各个stack之间的调用关系和采样时间

perf report -n --stdio

生成的图长这个样: 

但还是不易读和分析,于是就有了火焰图工具,该工具用pl脚本读取out.perf,画出各个函数的调用关系和占用时间。

下载

git clone https://github.com/brendangregg/FlameGraph.git

生成火焰图

用下面命令可以生成火焰图

./stackcollapse-perf.pl out.perf > out.folded
./flamegraph.pl out.folded > out.svg

生成后的结果实例如下(图片来源FlameGraph git),用chrome打开后可以点击查看分析那个函数最费时间。

这个图里面,横条长的就是花的时间长,就是需要进行优化的重点位置。

我遇到的是std::copy()用了很多的时间,经过了解,需要使用 -O3编译选项进行优化,优化后std::copy的时间就少了很多。

网上有讨论要不要用memcpy代替std::copy,因为std::copy与cpp 的特性结合的更好,所以建议使用std::copy。

Linux使用perf工具可以通过以下步骤进行操作。首先,根据内核版本进行安装,可以使用包管理工具进行安装,比如在Ubuntu下可以使用命令"apt-get install linux-tools-"$(uname -r)""进行安装。\[1\]如果无法使用包管理工具安装,可以手工编译安装perf工具。首先获取内核版本,使用命令"uname -a",然后在Linux内核托管的网站上找到对应的内核源码进行下载和解压。进入解压后的目录的tools/perf目录,执行make命令进行编译。编译完成后,在该目录下会生成perf的二进制文件,即我们需要的perf工具。\[1\]需要注意的是,编译过程可能会出现依赖库的问题,可以根据编译时的提示安装缺少的依赖包,然后重新编译即可获得全功能的perf工具。如果在使用perf工具时看不到调用的函数,说明编译的依赖不全,可以安装依赖包后重新编译。\[1\] 使用perf工具记录进程的CPU使用情况可以通过以下步骤进行操作。首先使用"perf record"命令记录进程的CPU使用情况,可以指定事件和进程ID,例如"sudo perf record -e cpu-clock -g -p 20000"。然后使用"perf script"工具perf.data进行解析,可以将解析结果输出到文件,例如"sudo perf script -i perf.data > perf.unfold"。接下来可以使用Flame Graph工具perf.unfold的符号折叠,生成脚本文件,例如"sudo FlameGraph/stackcollapse-perf.pl perf.unfold > perf.folded"。最后使用Flame Graph工具perf.folded生成SVG火焰图,可以下载到本地并用浏览器打开,例如"sudo FlameGraph/flamegraph.pl perf.folded > perf.svg"。\[2\] 如果希望在Linux永久修改perf工具的配置,使其在重启后仍然有效,可以编辑/etc/sysctl.conf文件,在文件末尾加上以下配置: kernel.kptr_restrict=0 kernel.perf_event_paranoid=-1 这样可以禁用内核的一些限制,使perf工具的功能更加完整。\[3\] #### 引用[.reference_title] - *1* [在linux环境安装perf工具,用于性能分析](https://blog.csdn.net/ghostlv/article/details/125305732)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [linux 性能分析工具perf](https://blog.csdn.net/tian830937/article/details/127722852)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [linux安装perf工具](https://blog.csdn.net/fadai1993/article/details/127324033)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值