Python程序的性能分析指南

最新推荐文章于 2024-09-27 10:11:28 发布

shanzhizi

最新推荐文章于 2024-09-27 10:11:28 发布

阅读量705

点赞数

分类专栏： python 文章标签： python

python 专栏收录该内容

48 篇文章 10 订阅

订阅专栏

分析一个程序的性能，总结下来就是要回答4个问题：

它运行的有多快？
它的瓶颈在哪？
它占用了多少内存？
哪里有内存泄漏？

接下来，我们会着手使用一些很棒的工具，来帮我们回答这些问题。

粗粒度的计算时间

我们先来用个很快的方法来给我们的代码计时：使用unix的一个很好的功能 time。

 
        $  
        time 
         python yourprogram.py 
       
        real    0m1.028s 
       
        user    0m0.001s 
       
        sys     0m0.003s

关于这3个测量值的具体含义可以看StackOverflow上的帖子，但是简要的说就是：

real：代表实际花费的时间
user:：代表cpu花费在内核外的时间
sys：代表cpu花费在内核以内的时间

通过把sys和user时间加起来可以获得cpu在你的程序上花费的时间。

如果sys和user加起来的时间比real时间要小很多，那么你可以猜想你的程序的大部分性能瓶颈应该是IO等待的问题。

用上下文管理器来细粒度的测量时间

我接下来要使用的技术就是让你的代码仪器化以让你获得细粒度的时间信息。这里是一个计时方法的代码片段：

 
        import 
         time 
       
        class 
         Timer( 
        object 
        ): 
       
        def 
         __init__( 
        self 
        , verbose 
        = 
        False 
        ): 
       
        self 
        .verbose  
        = 
         verbose 
       
        def 
         __enter__( 
        self 
        ): 
       
        self 
        .start  
        = 
         time.time() 
       
        return 
         self 
       
        def 
         __exit__( 
        self 
        ,  
        * 
        args): 
       
        self 
        .end  
        = 
         time.time() 
       
        self 
        .secs  
        = 
         self 
        .end  
        - 
         self 
        .start 
       
        self 
        .msecs  
        = 
         self 
        .secs  
        * 
         1000  
         # millisecs 
       
        if 
         self 
        .verbose: 
       
        print 
         'elapsed time: %f ms' 
         % 
         self 
        .msecs

为了使用它，将你想要测量时间的代码用Python关键字with和Timer上下文管理器包起来。它会在你的代码运行的时候开始计时，并且在执行结束的完成计时。

下面是一个使用它的代码片段：

 
        from 
         timer  
        import 
         Timer 
       
        from 
         redis  
        import 
         Redis 
       
        rdb  
        = 
         Redis() 
       
        with Timer() as t: 
       
        rdb.lpush( 
        "foo" 
        ,  
        "bar" 
        ) 
       
        print 
         "=> elasped lpush: %s s" 
         % 
         t.secs 
       
        with Timer as t: 
       
        rdb.lpop( 
        "foo" 
        ) 
       
        print 
         "=> elasped lpop: %s s" 
         % 
         t.secs