Gprof

最新推荐文章于 2023-04-25 08:27:25 发布

我要精通C++

最新推荐文章于 2023-04-25 08:27:25 发布

阅读量687

点赞数

分类专栏：性能之巅文章标签： gprof

本文链接：https://blog.csdn.net/Edidaughter/article/details/122161718

版权

性能之巅专栏收录该内容

10 篇文章 2 订阅

订阅专栏

1.官网链接

官网链接

写的不错

写的不错+1

2.使用方法与测试代码

1.编译时加-pg参数
g++ -O1 -g -pg 001.cpp               #生成可执行文件a.out

2.执行你的应用程序使之生成供gprof分析的数据gmon.out
./a.out                              #执行可执行文件生成文件gmon.out

3.分析数据
gprof a.out gmon.out > gprof.out     #执行gprof  exename gmon.out将结果写到gprof.out
vim -c 'set nowrap' gprof.out        #查看gprof.out中的内容

4.可视化你的数据
gprof ./a.out  | ./gprof2dot.py -n0 -e0 | dot -Tpng -o output.png
gprof ./a.out  | ./gprof2dot.py -n0 -e0 | dot -Tpdf -o output.pdf
(我推荐pdf形式的,可承载较大且我感觉更清晰)

#include <iostream>
#include <string.h>
using namespace std;
#define LOOPS 10000000
void test01()
{
   char buffer[80];
   auto t1 = clock();
   for(auto i = 0;i<LOOPS;++i)
   {
       memset(buffer,0,sizeof(buffer));
   }
   auto t2 = clock();
   cout << "cost " << (t2-t1)*1.0 <<endl;
}
void test02()
{
    char buffer[80];
    auto t1 = clock();
     for(auto i = 0;i<LOOPS;++i)
     {
         for(size_t j = 0;j < sizeof buffer;++j)
         {
             buffer[j] = 0;
         }
     }
    auto t2 = clock();
    cout << "cost " << (t2-t1)*1.0 <<endl;
}
void test03()
{
    volatile char buffer[80];
    auto t1 = clock();
     for(auto i = 0;i<LOOPS;++i)
     {
         for(size_t j = 0;j < sizeof buffer;++j)
         {
             buffer[j] = 0;
         }
     }
    auto t2 = clock();
    cout << "cost " << (t2-t1)*1.0 <<endl;
}

int main()
{  
      for(int i = 0;i<50;i++)
      {
         test01();
      } 
      test02();
      test03();
}

3.下载可视化工具及生成图片

yum install graphviz
wget https://github.com/jrfonseca/gprof2dot/blob/master/gprof2dot.py

4.Gprof的原理

Gprof的实现原理

Gprof的原理与缺陷

通过在编译和链接你的程序的时候（使用 -pg 编译和链接选项），gcc 在你应用程序的每个函数中都
加入了一个名为mcount(or “_mcount” , or “__mcount” , 依赖于编译器或操作系统)的函数，也就
是说你的应用程序里的每一个函数都会调用mcount, 而mcount会在内存中保存一张函数调用图，并通过
函数调用堆栈的形式查找子函数和父函数的地址.这张调用图也保存了所有与函数相关的调用时间、调用
次数等等的所有信息.

5.使用注意点

(1)一般gprof只能查看用户函数信息。如果想查看库函数的信息，需要在编译是再加入“-lc_p”编译参
  数代替“-lc”编译参数，这样程序会链接libc_p.a库，才可以产生库函数的profiling信息;
(2)gprof只能在程序正常结束退出之后才能生成程序测评报告，原因是gprof通过在atexit()里注册了
   一个函数来产生结果信息，任何非正常退出都不会执行atexit()的动作，所以不会产生gmon.out文件.
   如果你的程序是一个不会退出的服务程序，那就只有修改代码来达到目的。如果不想改变程序的运行方
   式，可以添加一个信号处理函数解决问题（这样对代码修改最少），例如：
   static void sighandler( int sig_no )   
   {   
      exit(0);   
   }   
   signal( SIGUSR1, sighandler )；
   当使用kill -USR1 pid 后，程序退出，生成gmon.out文件.

5.Gprof的缺陷

(1)gprof是GNU工具之一，它在编译的时候在每个函数的出入口加入了profiling的代码，运行时统计
程序在用户态的执行信息, 可以得到每个函数的调用次数、执行时间、调用关系等信息，简单易懂. 适
合于查找用户级程序的性能瓶颈, 对于很多时间都在内核态执行的程序，gprof不适合.

(2)需要重新编译链接源文件才行；

(3)对于服务器程序，一般是不会退出的. 如果程序没有正常退出,g++是不会生成最后的gmon.out统计
   结果的.所以gprof也就用不上了; 对于这种情况有一个解决办法: 在程序开始时注册一个信号捕获
   函数,如果收到注册的信号(比如SIGINT Ctrl-C),程序执行exit()的话,最后也是可以生成gmon.out
   的。