1.生成器 (generator)
通过列表生成式,我们可以直接创建一个列表。但由于内存限制,列表容量有限。
而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问
前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以,如果列表元素可以按
照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不
必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,
称为生成器:generator。
语句就返回。而变成generator的函数,在每次调用 next()的时候执行,遇到yield语句返回,
再次执行时从上次返回的yield语句处继续执行。
例如:定义一个generator,返回数字1,3,5:
返回值,直到最后抛出StopIteration错误表示无法继续返回下一个值:
可以直接作用于for循环的数据类型:
(1).集合数据类型,list, tuple, dict, set, str等
(2).generator,包括生成器和带yield的generator function
通过列表生成式,我们可以直接创建一个列表。但由于内存限制,列表容量有限。
而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问
前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以,如果列表元素可以按
照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不
必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,
称为生成器:generator。
第一种方法:修改列表生成式的[]为(),就创建了一个generator。
g = (x * x for x in range(10)
#斐波那契数列(Fibonacci)
#除第一个和第二个数外,任意一个数都可由前两个数相加得到
def fib(max):
n, a, b = 0, 0, 1
while n < max:
print(b)
a, b = b, a + b
n += 1
return 'done'
print(fib(6)
第二种方法:函数中包含 yield 关键字,该函数就不再是一个普通函数,而是一个generator
#将上述函数修改为generator
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n += 1
return 'done'
#由于遇到yield就会中断,要给循环设置一个条件来退出循环
#使用for循环来进行迭代调用next()获取下一个返回值
for n in fib(6):
print(n)
generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数
语句就返回。而变成generator的函数,在每次调用 next()的时候执行,遇到yield语句返回,
再次执行时从上次返回的yield语句处继续执行。
例如:定义一个generator,返回数字1,3,5:
def odd():
print('step 1')
yield 1
print('step 2')
yield(3)
print('step 3')
yield(5)
调用该generator时,首先要生成一个generator对象,然后用 next()函数不断获得下一个
返回值,直到最后抛出StopIteration错误表示无法继续返回下一个值:
>>> o = odd()
>>> next(o)
step 1
1
>>> next(o)
step 2
3
>>> next(o)
step 3
5
>>> next(o)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
'''
可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,
下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用
next(o)就报错。
'''
#杨辉三角
# _*_ coding:utf-8 _*_
def triangles(max):
n = 0
L = [1]
while True:
yield L
if n > max:
break
L = [1]+[L[i]+L[i+1] for i in range(n)]+[1]
n += 1
return 'done'
for n in triangles(10): #打印十行
print(n)
2.迭代器
可以直接作用于for循环的数据类型:
(1).集合数据类型,list, tuple, dict, set, str等
(2).generator,包括生成器和带yield的generator function
以上可以直接作用于for循环的对象统称为可迭代对象:Iterable.
可以使用 isintance()判断一个对象是否是可迭代对象
>>>from collections import Iterable
>>>isintance([], Iterable)
True
>>>isintance({}, Iterable)
True
>>> isinstance('abc', Iterable)
True
>>> isintance((x for x in range(10)), Iterable)
True
>>>isintance(100, Iterable)
False
可以被 next()函数调用并不断返回下一个值的对象称为迭代器:Iterator.
可以使用 isintance()判断一个对象是否是Iterator对象
>>> from collections import Iterator
>>> isinstance((x for x in range(10)), Iterator)
True
>>> isinstance([], Iterator)
False
>>> isinstance({}, Iterator)
False
>>> isinstance('abc', Iterator)
False
生成器都是Iterator对象,但是list, dict, str虽然是Iterable对象却不是Iterator。
把list、dict、str等Iterable变成Iterator可以使用 iter()函数
>>> isinstance(iter([]), Iterator)
True
>>> isinstance(iter('abc'), Iterator)
True
>>>list = [1, 2, 3, 4]
>>>list_t = list.__iter__()
>>>isinstance(list_t, Iterator)
True
#iter(), next()属于python的内置函数,而__iter__(), __next__()属于对象内置函数
#__next__()只有Iterator对象才有
'''
为什么list、dict、str等数据类型不是Iterator?
这是因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被 next()函数调
用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看
做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过 next()函数实现按
需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会
计算。
'''