perf工具的制作和使用

1、编译perf工具,perf工具存放在内核的tools/perf目录下
1.1、选择交叉编译工具链和架构

make CROSS_COMPILE=arm-linux- ARCH=arm tools/perf clean
make CROSS_COMPILE=arm-linux- ARCH=arm tools/perf

1.2、pef文件比较大,尝试strip一下

arm-linux-strip perf --strip-unneeded --strip-debug

1.3、file perf 命令确定下生成的perf工具是基于ARM架构的

2.内核需要打开的配置项
2.1、打开符号表
CONFIG_KALLSYMS=y
CONFIG_KALLSYMS_ALL=y
2.2、打开pef功能
CONFIG_PERF_EVENTS=y
CONFIG_HW_PERF_EVENTS=y
在这里插入图片描述
3、perf使用
3.1、perf top 或者perf top -p 1234可以比较清晰看出具体函数CPU使用率

perf top 
perf top -p 1234

3.2、获取某段时间CPU的使用情况

perf record -a         	#先抓取数据记录一段时间
perf report				#输出结果

3.3、当只出现地址,没有显示函数名时,通过addr2line获取函数名

arm-linux-addr2line -C -f -e perf 0009a9e8

3.4、获取火焰兔
3.4.1 获取recode数据

perf record -g -F 100 -a -p 1234

-g表示记录调用栈,-F 100表示每秒100次,-a表示所有CPU,-p 1234是进程号(对哪个进程进行分析,可以不加)
3.4.2 解析recode的数据

perf script -i perf.data &> perf.unfold

3.4.3 将perf.unfold中的符号进行折叠

./stackcollapse-perf.pl perf.unfold &> perf.folded

3.4.4 最后生成svg图

./flamegraph.pl perf.folded > perf.svg

第三,四步的pl文件下载路径见下,这PC上运行。生成perf.svg用浏览器打开就可以看到了。
https://github.com/brendangregg/FlameGraph

4、perf的详细使用
perf详细使用

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
google-perftools 简介 google-perftools 是一款针对 C/C++ 程序的性能分析工具,它是一个遵守 BSD 协议的开源项目。使用工具可以对 CPU 时间片、内存等系统资源的分配和使用进行分析,本文将重点介绍如何进行 CPU 时间片的剖析。 google-perftools 对一个程序的 CPU 性能剖析包括以下几个步骤。 1. 编译目标程序,加入对 google-perftools 库的依赖。 2. 运行目标程序,并用某种方式启动 / 终止剖析函数并产生剖析结果。 3. 运行剖结果转换工具,将不可读的结果数据转化成某种格式的文档(例如 pdf,txt,gv 等)。 安装 您可以在 google-perftools 的网站 (http://code.google.com/p/google-perftools/downloads/list) 上下载最新版的安装包。为完成步骤 3 的工作,您还需要一个将剖析结果转化为程序员可读文档的工具,例如 gv(http://www.gnu.org/software/gv/)。 编译与运行 您需要在原有的编译选项中加入对 libprofiler.so 的引用,这样在目标程序运行时会加载工具的动态库。例如本例中作者的系统中,libprofiler.so 安装在"/usr/lib"目录下,所以需要在 makefile 文件中的编译选项加入“-L/usr/lib -lprofiler”。 google-perftools 需要在目标代码的开始和结尾点分别调用剖析模块的启动和终止函数,这样在目标程序运行时就可以对这段时间内程序实际占用的 CPU 时间片进行统计和分析。工具的启动和终止可以采用以下两种方式。 a. 使用调试工具 gdb 在程序中手动运行性能工具的启动 / 终止函数。 gdb 是 Linux 上广泛使用的调试工具,它提供了强大的命令行功能,使我们可以在程序运行时插入断点并在断点处执行其他函数。具体的文档请参照 http://www.gnu.org/software/gdb/,本文中将只对用到的几个基本功能进行简单介绍。使用以下几个功能就可以满足我们性能调试的基本需求,具体使用请参见下文示例。 命令 功能 ctrl+c 暂停程序的运行 c 继续程序的运行 b 添加函数断点(参数可以是源代码中的行号或者一个函数名) p 打印某个量的值或者执行一个函数调用 b. 在目标代码中直接加入性能工具函数的调用,该方法就是在程序代码中直接加入调试函数的调用。 两种方式都需要对目标程序重新编译,加入对性能工具的库依赖。对于前者,他的好处是使用比较灵活,但工具的启动和终止依赖于程序员的手动操作,常常需要一些暂停函数(比如休眠 sleep)的支持才能达到控制程序的目的,因此精度可能受到影响。对于后者,它需要对目标代码的进行修改,需要处理函数声明等问题,但得到的结果精度较高,缺点是每次重新设置启动点都需要重新编译,灵活度不高,读者可以根据自己的实际需求采用有效的方式。 示例详解 该程序是一个简单的例子,文中有两处耗时的无用操作,并且二者间有一定的调用关系。 清单 1. 示例程序 void consumeSomeCPUTime1(int input){ int i = 0; input++; while(i++ < 10000){ i--; i++; i--; i++; } }; void consumeSomeCPUTime2(int input){ input++; consumeSomeCPUTime1(input); int i = 0; while(i++ < 10000){ i--; i++; i--; i++; } }; int stupidComputing(int a, int b){ int i = 0; while( i++ < 10000){ consumeSomeCPUTime1(i); } int j = 0; while(j++ < 5000){ consumeSomeCPUTime2(j); } return a+b; }; int smartComputing(int a, int b){ return a+b; }; void main(){ int i = 0; printf("reached the start point of performance bottle neck\n"); sleep(5); //ProfilerStart("CPUProfile"); while( i++ MyProfile.pdf 转换后产生的结果文档如下图。图中的数字和框体的大小代表了的某个函数的运行时间占整个剖析时间的比例。由代码的逻辑可知,stupidComputing,stupidComputing2 都是费时操作并且它们和 consumeSomeCPUTime 存在着一定的调用关系。 图 1. 剖析结果 结束语 本文介绍了一个 Linux 平台上的性能剖析工具 google-perftools,并结合实例向读者展示了如何使用工具配置、使用及分析性能瓶颈。
在Linux中使用perf工具可以通过以下步骤进行操作。首先,根据内核版本进行安装,可以使用包管理工具进行安装,比如在Ubuntu下可以使用命令"apt-get install linux-tools-"$(uname -r)""进行安装。\[1\]如果无法使用包管理工具安装,可以手工编译安装perf工具。首先获取内核版本,使用命令"uname -a",然后在Linux内核托管的网站上找到对应的内核源码进行下载和解压。进入解压后的目录中的tools/perf目录,执行make命令进行编译。编译完成后,在该目录下会生成perf的二进制文件,即我们需要的perf工具。\[1\]需要注意的是,编译过程中可能会出现依赖库的问题,可以根据编译时的提示安装缺少的依赖包,然后重新编译即可获得全功能的perf工具。如果在使用perf工具时看不到调用的函数,说明编译的依赖不全,可以安装依赖包后重新编译。\[1\] 使用perf工具记录进程的CPU使用情况可以通过以下步骤进行操作。首先使用"perf record"命令记录进程的CPU使用情况,可以指定事件和进程ID,例如"sudo perf record -e cpu-clock -g -p 20000"。然后使用"perf script"工具perf.data进行解析,可以将解析结果输出到文件中,例如"sudo perf script -i perf.data > perf.unfold"。接下来可以使用Flame Graph工具perf.unfold中的符号折叠,生成脚本文件,例如"sudo FlameGraph/stackcollapse-perf.pl perf.unfold > perf.folded"。最后使用Flame Graph工具perf.folded生成SVG火焰图,可以下载到本地并用浏览器打开,例如"sudo FlameGraph/flamegraph.pl perf.folded > perf.svg"。\[2\] 如果希望在Linux中永久修改perf工具的配置,使其在重启后仍然有效,可以编辑/etc/sysctl.conf文件,在文件末尾加上以下配置: kernel.kptr_restrict=0 kernel.perf_event_paranoid=-1 这样可以禁用内核的一些限制,使perf工具的功能更加完整。\[3\] #### 引用[.reference_title] - *1* [在linux环境中安装perf工具,用于性能分析](https://blog.csdn.net/ghostlv/article/details/125305732)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [linux 性能分析工具perf](https://blog.csdn.net/tian830937/article/details/127722852)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [linux安装perf工具](https://blog.csdn.net/fadai1993/article/details/127324033)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值