python模块-cProfile和line_profiler（性能分析器）

最新推荐文章于 2025-04-04 09:14:41 发布

loco_python

最新推荐文章于 2025-04-04 09:14:41 发布

阅读量3.4w

点赞数 5

分类专栏： Python模块文章标签： pstats cProfile python性能分析 line_profiler

本文链接：https://blog.csdn.net/weixin_40304570/article/details/79459811

版权

Python模块专栏收录该内容

7 篇文章

订阅专栏

本文详细介绍Python内置性能分析器cProfile的使用方法，包括其提供的多种API接口及其应用场景。此外，还介绍了如何利用pstats模块解析cProfile生成的数据，并对比了line_profiler的特点及安装使用流程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、cProfile介绍

cProfile自python2.5以来就是标准版Python解释器默认的性能分析器。
其他版本的python，比如PyPy里没有cProfile的。
cProfile是一种确定性分析器，只测量CPU时间，并不关心内存消耗和其他与内存相关联的信息。

二、支持的API

（一）run(command, filename=None, sort=-1)

第一种情况：

import cProfile
import re
cProfile.run('re.compile("aaa")')

这里写图片描述

第一行：189个函数调用被监控，其中184个是原生调用（不涉及递归）
ncalls：函数被调用的次数。如果这一列有两个值，就表示有递归调用，第二个值是原生调用次数，第一个值是总调用次数。
tottime：函数内部消耗的总时间。（可以帮助优化）
percall：是tottime除以ncalls，一个函数每次调用平均消耗时间。
cumtime：之前所有子函数消费时间的累计和。
filename:lineno(function)：被分析函数所在文件名、行号、函数名。

第二种情况：

import cProfile
import re
cProfile.run('re.compile("aaa|bbb")', 'stats', 'cumtime')

如果你去运行该代码，你会发现没有结果输出，但是生成了一个stats文件，里面是二进制数据。想读取文件，请见后面内容。

（二）runctx(command, globals, locals, filename=None）

run和runtx之间的区别：globals和locals是两个字典参数。

import cProfile

def runRe():
    import re
    cProfile.run('re.compile("aaa|bbb")')
runRe()

运行结果：
这里写图片描述

import cProfile
# 这样才对
def runRe():
    import re
    cProfile.runctx('re.compile("aaa|bbb")', None, locals())
runRe()

（三）Profile(custom_timer=None, time_unit=0.0, subcalls=True, builtins=True)

custom_timer：是一个自定义参数，可以通过与默认函数不同的方式测量时间。
如果custom_timer返回的是一个整数，time_unit是单位时间换成秒数。

返回方法

enable()：开始收集性能分析数据。
disable()：停止收集性能分析数据。
create_stats()：停止收集数据，并为已经收集数据创建stats对象。
print_stats(sort=-1)：创建一个stats对象，打印结果。
dump_stats(filename)：把当前性能分析的内容写入一个文件。
run(command)：和之前的一样。
runctx(command, golabls, locals)：和以前一样。
runcall(func, *args, **kwargs)：收集被调用函数func的性能分析信息。

from cProfile import Profile

def runRe():
    import re
    re.compile("aaa|bbb")

prof = Profile()
prof.enable()
runRe()
prof.create_stats()
prof.print_stats()

三、pstats模块和Stats类

（一）介绍

pstats模块为开发者提供了Stats类，可以读取和操作stats文件。
Stats类的构造器可以接受cProfile.Profile类型的参数，可以不用文件名称作为数据源。

（二）API

strip_dirs()：删除报告中所有函数文件名的路径信息，这个方法改变stats实例内部的顺序，任何运行该方法的实例都将随机排列项目的顺序。如果两个项目是相同的，那么这两个项目就可以合并。
add(*filenames)：将文件名对应的文件的信息加载到当前的stats对象中。
dump_stats(filename)：这个方法将加载的Stats类的数据保存为一个文件。
sort_stats(*keys)：通过一系列条件依次对所有项目进行排序，从而调整stats对象。

准则	含义	升序/降序排列
calls	调用次数	降序
cumulative	累计时间	降序
cumtime	累计时间	降序
file	文件名	升序
filename}文件名	升序
module	模块名	升序
ncalls	调用总次数	降序
pcalls	原始调用书	降序
line	行号	升序
name	函数名	升序
nfl	函数名/文件名/行号组合	降序
stdname	标准名称	升序
time	函数内部运行时间	降序
tottime	函数内部运行总时间	降序

- reverse_order()：这个方法回逆反原来参数的排序。
- print_stats(*restrictions)：这个方法把信息打印到STDOUT
- print_callees(*restrictions)：打印一列调用其他函数的函数。

import pstats
p = pstats.Stats('stats')
p.strip_dirs().sort_stats(-1).print_stats()

from cProfile import Profile
import pstats

def runRe():
    import re
    re.compile("aaa|bbb")

prof = Profile()
prof.enable()
runRe()
prof.create_stats()

p = pstats.Stats(prof)
p.print_callees()

这里写图片描述

四、line_profiler

（一）简介

这个性能分析器和cProfile不同，他能帮你一行一行的分析性能。
如果瓶颈问题在某一行中，这样就需要line_profiler解决了。
建议使用kernprof工具

（二）安装

pip install line_profiler

在安装过程中遇到问题，比如文件缺失，说明没有安装相关依赖，在Ubuntu中

sudo apt-get install python-dev libxml2-dev libxslt-dev

（三）kernprof

@profile
def fib(n):
    # 文件名aaa.py
    a, b = 0, 1
    for i in range(0, n):
        a, b = b, a+b
    return a
fib(5)

终端：kernprof -l aaa.py

kernprof默认情况下会把分析结果写入aaa.py.lprof文件，不过可以用-v显示在命令行里。

kernprof -l -v aaa.py

这里写图片描述

Line：文件中的行号。
Hits：性能分析时代码执行的次数。
Time：一段代码执行的总时间，由计数器决定。
Per Hit：执行一段代码平均消耗时间。
% Time：执行一段代码时间消耗比例。

（四）实例

line_profiler和cProfile一样：也提供了run，runctx，runcall，enable，disable方法，但是后两个并不安全，可以用dump_stats(filename)方法把stats加载到文件中，也可以用print_stats([stream])昂发打印结果。

# coding=utf-8
import line_profiler
import sys

def bbb():
    for i in range(0, 3):
        print i**2
    print 'end'

profile = line_profiler.LineProfiler(bbb)  # 把函数传递到性能分析器
profile.enable()  # 开始分析
bbb()
profile.disable()  # 停止分析
profile.print_stats(sys.stdout)  # 打印出性能分析结果

这里写图片描述