生成器
我们使用列表生成式创建一个列表会受到内存限制,列表的容量是有限的。并且如果我们创建一个包含100万个元素的列表时,不仅占用很大的储存空间,而且在我们仅仅需要访问前几个元素的时候,后面的绝大部分元素占用的空间都会白白浪费掉。
创建生成器(generator):这种一边循环一边计算的机制。我们就可以在循环的过程中不断推算出后续的元素,做到不创建完整的list,从而节省大量的空间。
第一种创建生成器的方法:把一个列表生成式的 [] 改为 () 创建了一个生成器
g = (x for x in range(100)) #创建生成器
for i in g : #使用迭代来调用生成器
print(i)
或者
print(next(g)) #通过next()函数获得generator的下一个返回值
print(next(g))
print(next(g))
print(next(g))
每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误 但是这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象。
所以我们创建了一个generator时基本上永远不会调用next(),而是通过for循环来迭代他,并且不需要关心StopIteration的错误。
第二种创建生成器的方法:
著名的斐波拉契数列(Fibonacci):
def fib(n):
a = 1
b = 1
while n:
print(a)
a,b = b,a+b
n = n-1
要把fib函数变成generator,只需要把print(b)改为yield b就可以了
def fib(n):
a = 1
b = 1
while n:
yield a
a,b = b,a+b
n = n-1
for ii in fib(10):
print(ii)
杨辉三角
def yanghui(n):#定义一个函数,函数参数为n
list1=[1]
for i in range(n): # 循环确定杨辉三角列数
yield list1 # 输出列表list1
list2=[1]
for j in range(len(list1)-1): # 循环确定list1的下标
list2.append(list1[j]+list1[j+1])#将list1 中相邻两个下标对应的值相加后添加到list2中
list2.append(1)#在list2的末尾添加元素1
list1=list2#将list2的值赋予list1
for j in yanghui(10):
print(j)
迭代器
可以直接作用于for循环的数据类型有以下几种:
一类是集合数据类型,如list、tuple、dict、set、str等;
一类是generator,包括生成器和带yield的generator function。
这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。
可以使用isinstance()判断一个对象是否是Iterable对象:
# from collections.abc import Iterable
# a=isinstance([],Iterable)
# print(a)
# b=isinstance('ABF', Iterable)
# print(b)
# c=isinstance(123,Iterable)
# print(c)
# d=isinstance((x for x in range(10)),Iterable)
# print(d)
可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator
生成器都是迭代器(Iterator)对象,但list、dict、str虽然是可迭代对象Iterable,却不是迭代器Iterator。
可以使用isinstance()判断一个对象是否是Iterator对象:
from collections.abc import Iterator
a = isinstance((x for x in range(10)), Iterator)
print(a)
b = isinstance([], Iterator)
print(b)
c = isinstance({}, Iterator)
print(c)
d = isinstance('abc', Iterator)
print(d)
生成器都是Iterator对象,但list、dict、str虽然是Iterable,却不是Iterator
把list、dict、str等Iterable变成Iterator可以使用iter()函数:
from collections.abc import Iterator
a = isinstance(iter([]), Iterator)
print(a)
b = isinstance(iter('abc'), Iterator)
print(b)
生成器都是Iterator对象,但list、dict、str虽然是Iterable,却不是Iterator因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。
小结
凡是可作用于for循环的对象都是Iterable类型;
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
Python的for循环本质上就是通过不断调用next()函数实现的,例如: