利用perf热点分析工具在程序运行时进行数据采样, 然后使用FlameGraph火焰图生成工具将采样的数据转换成svg图片,便于直观的查看各个函数的开销占比以及调用关系
1、安装perf
参考:https://my.oschina.net/u/4702401/blog/5130132
# 安装 perf, 这里根据不同的内核版本安装方式可能有所不同,需要先在终端输入perf,然后根据提示安装特定版本的perf工具或者源码安装
sudo apt install linux-tools-generic linux-tools-$(uname -r)
# 使用 perf
perf record -e cpu-clock -g xxxbin程序
2、perf record常用参数,可通过perf record –help查看
-e:指定采样事件,如cpu-cycles,cache-misses,branch-instructions,branch-misses
-p:指定要跟踪的进程pid
-t:指定要跟踪的线程id,用于抓取单个线程的信息
-F:指定采样频率,避免采样数据过大,或降低对程序的性能影响
-g:记录调用栈信息-
-call-graph:指定调用栈信息获取方式,支持fp/dwarf/lbr三种方式。
调用栈获取方式说明:
fp:需要加上-fno-omit-frame-pointer
dwarf:需要加上-g
lbr:需要使用intel的平台
3、安装火焰图生成工具FlameGraph
参考:
https://zhuanlan.zhihu.com/p/147875569
FlameGraph github 地址:
https://github.com/brendangregg/FlameGraph
# 1. 将FlameGraph git clone 到本地,会在本地生成一个FlameGraph文件夹,用于后续折叠调用栈和生成火焰图
git clone https://github.com/brendangregg/FlameGraph.git
4、生成火焰图步骤
# 1.利用perf热点分析工具进行程序性能分析
perf record xxx可执行程序
# 2. 使用perf 将上述生成的perf.data二进制文件直接转化成文本文件perf.unfold
perf.unflodperf script -i perf.data &> perf.unfold
# 3. 折叠调用栈,在FlameGraph根目录下运行:
./stackcollapse-perf.pl /zdrive/hdmap/tools/road_cognition/scripts/perf.unfold &> perf.folded
# 4. 生成火焰图perf.svg,在FlameGraph根目录下运行:
./flamegraph.pl perf.folded > perf.svg
# 5.将生成的perf.svg使用浏览器打开即可直观的查看程序各个函数的开销