Python在性能方面不卓越,但是使用一些小技巧,可以提高Python程序的性能,避免不必要的资源浪费。
1. 使用局部变量
尽可能使用局部变量替代全局变量,可以是程序易于维护并且有助于提高性能节约成本。
在模块命名空间中将变量替换为局部变量,例如ls = os.linesep。一方面,可以提高程序性能,因为局部变量的搜素速度更快;另一方面,用短标识替换长模块变量,提高可阅读性。
2. 减少函数调用的数量
当需要确定对象类型时,使用isinstance()方法最好,id()次之,type()最差。
为了避免重复计算,不要把重复操作作为参数放入循环中。
使用模块X中的函数或者对象Y时,应该用from X import Y,而不是import X; X.Y。因此,当使用Y时,可以减少一次查询(解析器不必先找到模块X,然后在模块X的字典中查找Y)。
3. 使用映射来替换条件搜索
映射(例如dict,等等)的搜索速度比条件语句(例如if,等等)快很多。在Python中没有select-case语句。
4. 直接迭代序列元素
对于序列(str, list, tuple, 等等),直接迭代序列元素比迭代元素索引要快。
5. 用生成器表达式替换列表解析
列表解析生成整个列表,会对大量数据的迭代产生负面作用。
而生成器表达式不会。生成器表达式不会创建一个列表,相反返回一个生成器,在需要的时候生成具体值(延迟的),这种方式对内存友好。
6. 先编译后调用
当使用函数eval()和exec()来执行代码时,最好调用代码对象(通过compile()函数预先编译成字节码)而不是直接调用str,这样可以避免重复编译过程多次和提高程序的性能。
正则表达式模式匹配是类似的。 在执行比较和匹配之前,最好将正则表达式模式编译为正则表达式对象(通过re.complie()函数)。
7. 模块编程的习惯
模块中最高级别的Python语句(无缩进代码)将在导入模块时执行(是否真的需要执行)。 因此,您应该尝试将模块的所有功能代码放入函数中(与主程序相关的功能代码也可以放入main()函数,主程序本身调用main()函数)。
测试代码可以写在模块的main()函数中。 将在主程序中检测__name__的值。 如果是"__main__"(表示模块是直接执行的),则调用main()函数进行测试; 如果它是模块的名称(表示模块被调用),则不会执行测试。