如何快速分析一个程序的计算热点在那些函数呢,perf可以快速看到大概的计算资源发布:
实验在如下环境中开展:
X86 Intel(R) core i7
安装好perf之后,perf record出现如下问题:
转换到root 账户。
perf record -e cpu-clock ./test_block_matrix 32 (源码在上篇blog)
perf report:
时间差不多六四开,基本符合profiling 结果。
Enter:
Enter:
编译加上-g时,会看到c代码:
Ref:
RRRPERF tutorial: Finding execution hot spots | Sand, software and sound