1.迭代器和生成器
生成器
通过列表生成式,我们可以直接创建一个列表,但是受内存限制,列表容器肯定是有限的,而创建一个包含100万个元素的列表,
不仅占用了很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面的绝大元素占用的空间就白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推断算出后续元素呢?这样就不必创建完整的list,从而节省大量的空间,
在python中,这种一遍循环一遍计算的机制,称为生成器:generator
在python3.0中range函数是一个迭代器。
>>> L = [x*x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x*x for x in range(10))
>>> g
<generator object <genexpr> at 0x024693A0>
>>>
创建L和g的区别仅仅在于最外层的 [] 和 () ,L是一个list,而g是一个generator.
我们可以直接打印出list的每个元素,但我们怎么打印出generator的每一个元素呢?如果一个个打印出来,可以通过next()函数获得generator的下一个返回值:
>>> g = (x*x for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g)
9
>>> next(g)
16
>>> next(g)
25
>>> next(g)
36
>>> next(g)
49
>>> next(g)
64
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
generator保存的是算法,每次调用next(g),就计算出g下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出Stopiteration错误。
正确做法使用for循环,因为generator也是可迭代对象:
>>> g
=
(x
*
x
for
x
in
range
(
10
))
>>>
for
n
in
g:
...
print
(n)
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for
循环无法实现的时候,还可以用函数来实现。
斐波拉契数列推算规则:
#!/usr/bin/env python
# _*_ coding:utf-8 _*_
def fibr(max):
n,a,b=0,0,1
while n < max:
yield b
a,b = b,a+b
n += 1
return "done"
f = fibr(10)
print(f)
print(f.__next__())
print(f.__next__())
print(f.__next__())
print(f.__next__())
print(f.__next__())
print(f.__next__())
print(f.__next__())
print(f.__next__())
如果函数定义中含有yield关键字,那么它不是一个普通的函数,而是一个生成器generator。每次调用next()时执行,
遇到yield语句返回,再执行时从上次的yield语句处继续执行。同样我们基本从来不用next()来获取下一个返回值,
而是直接使用for循环来迭代。
for n in f:
print(n)
但是用for
循环调用generator时,发现拿不到generator的return
语句的返回值。如果想要拿到返回值,必须捕获StopIteration
错误,返回值包含在StopIteration
的value
中:
while True:
try:
x = next(f)
print(x)
except StopIteration as e:
print("Generator return value:",e.value)
break
迭代器
我们已经知道,可以作用在for循环的数据类型有以下几种:
一类是集合数据类型:list,dict,tuple,set,str
一类是generator,包括生成器和带yield的generator function
这些直接作用于for循环的对象统称为可迭代对象:Iterable。可以使用isinstance()判断一个对象是否是Iterable对象
from collections import Iterable
isinstance([],Iterable)
isinstance({},Iterable)
print(isinstance("abc",Iterable))
*可以被next()
函数调用并不断返回下一个值的对象称为迭代器:Iterator
。生成器都是Iterator
对象,但list
、dict
、str
虽然是Iterable
,却不是Iterator
。
你可能会问,为什么list
、dict
、str
等数据类型不是Iterator
?
这是因为Python的Iterator
对象表示的是一个数据流,Iterator对象可以被next()
函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration
错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()
函数实现按需计算下一个数据,所以Iterator
的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator
甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。
it = iter([1,2,3,4,5,6])
while True:
try:
x = next(it)
print(x)
except StopIteration:
break
异常处理
捕捉异常可以使用try/except语句。
try/except语句用来检测try语句块中的错误,从而让except语句捕获异常信息并处理。
如果你不想在异常发生时结束你的程序,只需在try里捕获它。
语法:
以下为简单的try....except...else的语法:
try:
<语句> #运行别的代码
except <名字>:
<语句> #如果在try部份引发了'name'异常
except <名字>,<数据>:
<语句> #如果引发了'name'异常,获得附加的数据
else:
<语句> #如果没有异常发生
try的工作原理是,当开始一个try语句后,python就在当前程序的上下文中作标记,这样当异常出现时就可以回到这里,try子句先执行,接下来会发生什么依赖于执行时是否出现异常。
- 如果当try后的语句执行时发生异常,python就跳回到try并执行第一个匹配该异常的except子句,异常处理完毕,控制流就通过整个try语句(除非在处理异常时又引发新的异常)。
- 如果在try后的语句里发生了异常,却没有匹配的except子句,异常将被递交到上层的try,或者到程序的最上层(这样将结束程序,并打印缺省的出错信息)。
- 如果在try子句执行时没有发生异常,python将执行else语句后的语句(如果有else的话),然后控制流通过整个try语句。