本文会介绍一些Python代码加速运行的技巧。介绍之前需要了解一些代码优化的基本原则
不要过早优化
-
优化的前提是代码能正常工作。过早地进行优化可能会忽视对总体性能指标的把握,在得到全局结果前不要主次颠倒。
优化的代价
-
优化是有代价的,想解决所有性能的问题是几乎不可能的。
忽略无关紧要的部分
-
如果对代码的每一部分都去优化,这些修改会使代码难以阅读和理解,专注于运行慢的地方进行优化。
1.不要使用全局变量
代码耗时:26.8秒
import math
batch = 10000
for i in range(batch):
for j in range(batch):
z = math.sqrt(i) + math.sqrt(j)
由于全局变量和局部变量实现方式不同,定义在全局范围内的代码运行速度会比定义在函数中的慢不少。通过将脚本语句放入到函数中,通常可带来 15% - 30% 的速度提升。
代码耗时:20.6秒
import math
def main():
# 将想要使用的变量写到函数之中去避免使用全局变量
batch = 10000
for i in range(batch):
for j in range(batch):
z = math.sqrt(x) + math.sqrt(y)
2.使用from improt 的导包方式
代码耗时:14.5秒
import math
建议使用 代码执行时间为10.9秒
from math import sqrt
def Sqrt(number: int):
result = []
for i in range(number):
result.append(math.sqrt(i))
return result
3.拼接字符串时使用join而不是+
字符串拼接用join而不是+
# 不推荐写法,代码耗时:2.6秒
import string
from typing import List
def concatString(string_list: List[str]) -> str:
result = ''
for str_i in string_list:
result += str_i
return result
def main():
string_list = list(string.ascii_letters * 100)
for _ in range(10000):
result = concatString(string_list)
main()
当使用a + b拼接字符串时,由于 Python 中字符串是不可变对象,其会申请一块内存空间,将a和b分别复制到该新申请的内存空间中。因此,如果要拼接n个字符串,会产生 n-1个中间结果,每产生一个中间结果都需要申请和复制一次内存,严重影响运行效率。而使用join()拼接字符串时,会首先计算出需要申请的总的内存空间,然后一次性地申请所需内存,并将每个字符串元素复制到该内存中去。
4.选择适合的数据结构
Python 内置的数据结构如str, tuple, list, set, dict底层都是 C 实现的,速度非常快,自己实现新的数据结构想在性能上达到内置的速度几乎是不可能的。
当需要在list频繁查找某些元素,或频繁有序访问这些元素时,可以使用bisect维护list对象有序并在其中进行二分查找,提升查找的效率
推荐大家可以去看看这本书:流畅的Python