1.官网链接
2.使用方法与测试代码
1.编译时加-pg参数
g++ -O1 -g -pg 001.cpp #生成可执行文件a.out
2.执行你的应用程序使之生成供gprof分析的数据gmon.out
./a.out #执行可执行文件生成文件gmon.out
3.分析数据
gprof a.out gmon.out > gprof.out #执行gprof exename gmon.out将结果写到gprof.out
vim -c 'set nowrap' gprof.out #查看gprof.out中的内容
4.可视化你的数据
gprof ./a.out | ./gprof2dot.py -n0 -e0 | dot -Tpng -o output.png
gprof ./a.out | ./gprof2dot.py -n0 -e0 | dot -Tpdf -o output.pdf
(我推荐pdf形式的,可承载较大且我感觉更清晰)
#include <iostream>
#include <string.h>
using namespace std;
#define LOOPS 10000000
void test01()
{
char buffer[80];
auto t1 = clock();
for(auto i = 0;i<LOOPS;++i)
{
memset(buffer,0,sizeof(buffer));
}
auto t2 = clock();
cout << "cost " << (t2-t1)*1.0 <<endl;
}
void test02()
{
char buffer[80];
auto t1 = clock();
for(auto i = 0;i<LOOPS;++i)
{
for(size_t j = 0;j < sizeof buffer;++j)
{
buffer[j] = 0;
}
}
auto t2 = clock();
cout << "cost " << (t2-t1)*1.0 <<endl;
}
void test03()
{
volatile char buffer[80];
auto t1 = clock();
for(auto i = 0;i<LOOPS;++i)
{
for(size_t j = 0;j < sizeof buffer;++j)
{
buffer[j] = 0;
}
}
auto t2 = clock();
cout << "cost " << (t2-t1)*1.0 <<endl;
}
int main()
{
for(int i = 0;i<50;i++)
{
test01();
}
test02();
test03();
}
3.下载可视化工具及生成图片
yum install graphviz
wget https://github.com/jrfonseca/gprof2dot/blob/master/gprof2dot.py
4.Gprof的原理
通过在编译和链接你的程序的时候(使用 -pg 编译和链接选项),gcc 在你应用程序的每个函数中都
加入了一个名为mcount(or “_mcount” , or “__mcount” , 依赖于编译器或操作系统)的函数,也就
是说你的应用程序里的每一个函数都会调用mcount, 而mcount会在内存中保存一张函数调用图,并通过
函数调用堆栈的形式查找子函数和父函数的地址.这张调用图也保存了所有与函数相关的调用时间、调用
次数等等的所有信息.
5.使用注意点
(1)一般gprof只能查看用户函数信息。如果想查看库函数的信息,需要在编译是再加入“-lc_p”编译参
数代替“-lc”编译参数,这样程序会链接libc_p.a库,才可以产生库函数的profiling信息;
(2)gprof只能在程序正常结束退出之后才能生成程序测评报告,原因是gprof通过在atexit()里注册了
一个函数来产生结果信息,任何非正常退出都不会执行atexit()的动作,所以不会产生gmon.out文件.
如果你的程序是一个不会退出的服务程序,那就只有修改代码来达到目的。如果不想改变程序的运行方
式,可以添加一个信号处理函数解决问题(这样对代码修改最少),例如:
static void sighandler( int sig_no )
{
exit(0);
}
signal( SIGUSR1, sighandler );
当使用kill -USR1 pid 后,程序退出,生成gmon.out文件.
5.Gprof的缺陷
(1)gprof是GNU工具之一,它在编译的时候在每个函数的出入口加入了profiling的代码,运行时统计
程序在用户态的执行信息, 可以得到每个函数的调用次数、执行时间、调用关系等信息,简单易懂. 适
合于查找用户级程序的性能瓶颈, 对于很多时间都在内核态执行的程序,gprof不适合.
(2)需要重新编译链接源文件才行;
(3)对于服务器程序,一般是不会退出的. 如果程序没有正常退出,g++是不会生成最后的gmon.out统计
结果的.所以gprof也就用不上了; 对于这种情况有一个解决办法: 在程序开始时注册一个信号捕获
函数,如果收到注册的信号(比如SIGINT Ctrl-C),程序执行exit()的话,最后也是可以生成gmon.out
的。