这里简单写了我日常里没有学到的高级特性,或者功能。廖雪峰老师的python教程写的十分详细,如果能一句一篇的看完,定有大收获例如仿函数,列表解析式,线程,进程,协程,enmurate,map,reduce,filter,itertools等等。这里我已经看了这篇教程2,3遍了,对其中的基本特性也写过类似代码。每次再看都会有大收获
slots魔法
在Python中,每个类都有实例属性。默认情况下Python用一个字典来保存一个对象的实例属性。这非常有用,因为它允许我们在运行时去设置任意的新属性。
然而,对于有着已知属性的小类来说,它可能是个瓶颈。这个字典浪费了很多内存。Python不能在对象创建时直接分配一个固定量的内存来保存所有的属性。因此如果你创建许多对象(我指的是成千上万个),它会消耗掉很多内存。
不过还是有一个方法来规避这个问题。这个方法需要使用__slots__
来告诉Python不要使用字典,而且只给一个固定集合的属性分配空间。
- 不使用
__slots__
:
class MyClass(object):
def __init__(self, name, identifier):
self.name = name
self.identifier = identifier
self.set_up() # ...
- 使用
__slots__
:
class MyClass(object):
__slots__ = ['name', 'identifier']
def __init__(self, name, identifier):
self.name = name
self.identifier = identifier
self.set_up() # ...
第二段代码会为你的内存减轻负担。通过这个技巧,有些人已经看到内存占用率几乎40%~50%的减少。
稍微备注一下,你也许需要试一下PyPy。它已经默认地做了所有这些优化。
多使用__slots__,少用__dict__
如果在循环里使用self.xxx
从对象上访问属性,这其实有一个dict lookup
的过程。可先将对象的属性在循环外存为局部变量再在循环内访问局部变量。原理是,python访问局部变量,在C语言层是数组下标访问,而使用dot符号则是散列表访问,自然是访问数组速度更快。
For - Else
for
循环还有一个else
从句,我们大多数人并不熟悉。这个else
从句会在循环正常结束时执行。这意味着,循环没有遇到任何break
. 一旦你掌握了何时何地使用它,它真的会非常有用。我自己对它真是相见恨晚。
有个常见的构造是跑一个循环,并查找一个元素。如果这个元素被找到了,我们使用break
来中断这个循环。有两个场景会让循环停下来。
-
第一个是当一个元素被找到,
break
被触发。 -
第二个场景是循环结束。
现在我们也许想知道其中哪一个,才是导致循环完成的原因。一个方法是先设置一个标记,然后在循环结束时打上标记。另一个是使用else
从句。
这就是for/else
循环的基本结构:
for item in container:
if search_something(item):
# Found it!
process(item)
break
else:
# Didn't find anything..
not_found_in_container()
考虑下这个简单的案例,它是我从官方文档里拿来的:
for n in range(2, 10):
for x in range(2, n):
if n % x == 0:
print(n, 'equals', x, '*', n / x)
break
它会找出2到10之间的数字的因子。现在是趣味环节了。我们可以加上一个附加的else语句块,来抓住质数,并且告诉我们:
for n in range(2, 10):
for x in range(2, n):
if n % x == 0:
print(n, 'equals', x, '*', n / x)
break
else:
# loop fell through without finding a factor
print(n, 'is a prime number')