python编程书写技巧_5招教你提高编写python代码的效率

相信很多学Python语言的人在学习上肯定会接触到python代码,那你会不会感到写起来没什么效率呢?关键是你没有抓到技巧。有经验的人会这样做:先清楚的设计、再写伪代码再完善、最后代码先语法review后再启动编译 。而本文将会讲5招关于怎样提高效率的贴士,有兴趣的朋友快来看看吧!

56fb92f5b7cae.jpg

第一招:蛇打七寸:定位瓶颈

首先,第一步是定位瓶颈。举个简单的栗子,一个函数可以从1秒优化到到0.9秒,另一个函数可以从1分钟优化到30秒,如果要花的代价相同,而且时间限制只能搞定一个,搞哪个?根据短板原理,当然选第二个啦。

一个有经验的程序员在这里一定会迟疑一下,等等?函数?这么说,还要考虑调用次数?如果第一个函数在整个程序中需要被调用100000次,第二个函数在整个程序中被调用1次,这个就不一定了。举这个栗子,是想说明,程序的瓶颈有的时候不一定一眼能看出来。还是上面那个选择,程序员的你应该有感觉的,大多数情况下:一个「可以」从一分钟优化到30秒的函数会比一个「可以」从1秒优化到0.9秒的函数更容易捕获我们的注意,因为有很大的进步空间嘛。

所以,这么多废话讲完,献上第一招,profile。这是 python 自带的定位程序瓶颈的利器!虽然它提供了三种选项profile,cProfile,hotshot。还分为内置和外置。但是,个人觉得一种足矣,外置cProfile。心法如下:

56fb933116e99.png

这招的效果会输出一系列东西,比如函数被调用了几次,总时间多少,其中有多少是这个函数的子函数花费的,每次花多少时间,唯一图胜千言:

filename:lineno(function): 文件名:第几行(函数名)

ncalls: 这货一共调用了几次

tottime: 这货自己总共花了多少时间,也就是要除掉内部函数小弟们的花费

percall: 平均每次调用花的时间,tottime 除以 ncalls

cumtime: 这货还有它的所有内部函数小弟们的总花费

percall: 跟上面那个 percall 差不多,不过是 cumtime 除以 ncalls

找到最值得优化的点,然后干吧。

第二招:一蛇禅:只需一招

记得刚开始接触 Python 的时候,有一位学长告诉我,Python 有一个牛逼的理想,它希望每一个用它的人能写出一模一样的程序。Python 之禅有云:

There should be one-- and preferably only one --obvious way to do it

所以 Python 系专业的禅师提供了一些常用功能的 only one 的写法。本人看了一下传说中的PythonWiKi:PerformanceTiPS,总结了几个要点。

合并字符串的时候不要这样:

56fb93c4119a4.png

要这样:

56fb93e88d1e8.png

格式化字符串的时候不要这样:

56fb940d97003.png

要这样:

56fb955667c29.png

可以不用循环的时候就不要用循环,比如不要这样:

56fb959f6d340.png

要这样:

56fb95d0793f2.png

或者这样:

56fb95f0b3cae.png

字典初始化,比较常用的:

56fb9612a01c5.png

如果重复的 word 太多了的话,可以考虑用这个模式来省掉大量判断:

56fb963d59940.png

第三招:蛇之狙击:高速搜索

这一招部分来源于IBM:Python 代码性能优化技巧,搜索算法的最高境界是O(1)的算法复杂度。也就是 Hash Table。本人幸本科的时候学了点数据结构。知道 Python 的 list 使用类似链表的方法实现的。如过列表很大的话,在茫茫多的项里面用 if X in list_a 来做搜索和判断效率是非常低的。

Python 的 tuple 我用得非常少,不评论。另两个我用得非常多的是 set 和 dict。这两个就是用的类似 Hash Table 的实现方法。

要这样做:

56fb968561001.png

先把 list 转换成 dictionary

56fb96a3ee60f.png

找 list 的交集:

56fb96ce8c5b3.png

第四招:各种小 Tips

变量交换不需要中间变量:a,b = b,a (这里有个神坑,至今记忆深刻:True,False = False,True)

如果使用 Python2.x,用 xrange 代替 range,如果用 Python3.x,range 已经是 xrange 了,xrange 已经木有了。xrange 不会像 range 一样生成一个列表,而是生成一个迭代器,省内存。可以用 x>y>z 代替 x>y and y>z。效率更高,可读性也更好。当然理论上 x>y。

add(x,y) 一般会比 a+b 要快?这个本人有所怀疑,实验了一下,首先 add 不能直接用,要 import operator。

第二,我的实验结果表示 add(x,y) 完全没有 a+b 快,更何况还要牺牲可读性。

while 1 确实比 while True 要快那么一点点。做了两次实验,大概快了15%左右。

第五招:无蛇胜有蛇:代码之外的性能

代码除了硬件之外,就是编译器了,这里隆重推荐 pypy。pypy是一种叫做 just-in-time 的即时编译器。这个编译器的特点就是编译一句跑一句,和静态的编译器的区别嘛,我在知乎上看到一个非常形象的比喻:

假定你是一个导演,静态编译就是让演员把整个剧本背下来吃透,然后连续表演一个小时。动态编译就是让演员表演两分钟,然后思考一下,再看一下剧本,再表演两分钟……

动态编译和静态编译各有所长,看你演的是电影还是话剧了。

此外还有一个 Cython 可以在 python 里内置一些 C 的代码。我用的非常少,但是关键时刻确实有效。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值