目录
一、迭代器
1.可迭代对象
我们已经知道可以对list、tuple、str等类型的数据使用for…in…的循环语法从其中依次拿到数据进行使用,我们把这样的过程称为遍历,也叫迭代。
但是如果我们将无法迭代的,也就是不是迭代的对象放入for…in中循环,就会出现错误:
for i in 100:
print(i)
# Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# TypeError: 'int' object is not iterable
这个报错代表了什么呢,int并不是iterable,即为可迭代对象,我们就能理解为,使用for…in方法后面循环的必须是一个迭代对象,那么为什么只能循环迭代对象呢,迭代对象和其他对象之间区别又是什么。
2.怎么判定迭代对象(isinstance())
我们去判断一个对象是否为迭代对象,可以用Python的内置函数isinstance()这个方法,用法如下:
from collections import Iterable
isinstance([], Iterable)
# True 列表为迭代对象
isinstance({}, Iterable)
# True 字典为迭代对象
isinstance('abc', Iterable)
# True 字符串为迭代对象
isinstance(mylist, Iterable)
# False 普通对象不为迭代对象
isinstance(100, Iterable)
# False 整形/浮点数不为迭代对象
可以看出不同的对象类型都不一样,那么他是根据什么判断他是否是迭代对象呢。
3.可迭代对象的本质
在每次for…in中,循环一次,都会返回对象中的下一条数据,一直到所有的数据结束,在这个过程中需要去记录访问到了第几条,这个称作迭代器
可迭代对象的本质就是因为有迭代器为他计算调用,使得其可以遍历
可迭代对象通过__iter__方法向我们提供一个迭代器的功能,我们在迭代时,就是用提供的迭代器返回调用迭代方法来获取每一个数据
具备了一个迭代方法,他就是一个可迭代对象:
from collections.abc import Iterable
class Demo(object):
def __init__(self, n):
self.n = n
self.current = 0
def __iter__(self):
pass
demo = Demo(10)
print(isinstance(demo, Iterable)) # True
for d in demo: # 重写了 __iter__ 方法以后,demo就是一个一个可迭代对象了,可以放在for...in的后面
print(d)
# 此时再使用for...in循环遍历,会提示 TypeError: iter() returned non-iterator of type 'NoneType'
# 这是因为,一个可迭代对象如果想要被for...in循环,它必须要有一个迭代器
但是单单重写了__iter__方法还是不够的,它在执行时会调用一个__next__方法,next方法中装着下一个返回对象的返回方法以及返回条件。
class MyIterator(object):
def __init__(self, n):
self.n = n
self.current = 0
# 自定义迭代器需要重写__iter__和__next__方法
def __iter__(self):
return self
def __next__(self):
if self.current < self.n:
value = self.current
self.current += 1
return value
else:
raise StopIteration #抛出停止异常,控制台不会显示这个报错。
my_it = MyIterator(10)
for i in my_it: # 迭代器重写了__iter__方法,它本身也是一个可迭代对象
print(i)
迭代器属于一个类,生成器是一个方法,下面我们来说说生成器。
二、生成器
1.生成器介绍
利用迭代器,我们可以在每次迭代获取数据(通过next()方法)时按照特定的规律进行生成。但是我们在实现一个迭代器时,关于当前迭代到的状态需要我们自己记录,进而才能根据当前状态生成下一个数据。为了达到记录当前状态,并配合next()函数进行迭代使用,我们可以采用更简便的语法,即生成器(generator)。生成器是一类特殊的迭代器。
2.创建生成器方法1
要创建一个生成器,有很多种方法。第一种方法很简单,只要把一个列表生成式的 [ ] 改成 ( )
L = [ x*2 for x in range(5)]
print(L) #[0, 2, 4, 6, 8]
G = ( x*2 for x in range(5))
print(G) #<generator object <genexpr> at 0x7f626c132db0>
创建 L 和 G 的区别仅在于最外层的 [ ] 和 ( ) , L 是一个列表,而 G 是一个生成器。我们可以直接打印出列表L的每一个元素,而对于生成器G,我们可以按照迭代器的使用方法来使用,即可以通过next()函数、for循环、list()等方法使用。
3. 创建生成器方法2
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的 for 循环无法实现的时候,还可以用函数来实现。
def fib(n):
current = 0
num1, num2 = 0, 1
while current < n:
yield num1
num1, num2 = num2, num1+num2
current += 1
return 'done'
在使用生成器实现的方式中,我们将原本在迭代器__next__方法中实现的基本逻辑放到一个函数中来实现,但是将每次迭代返回数值的return换成了yield,此时新定义的函数便不再是函数,而是一个生成器了。简单来说:只要在def中有yield关键字的 就称为 生成器
###但是用for循环调用generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中:
def fib(n):
current = 0
num1, num2 = 0, 1
while current < n:
yield num1
num1, num2 = num2, num1+num2
current += 1
return 'done'
g = fib(5)
while True:
try:
x = next(g)
print("value:%d"%x)
except StopIteration as e:
print("生成器返回值:%s"%e.value)
break
#value:1
#value:1
#value:2
#value:3
#value:5
#生成器返回值:done
三、总结
- 使用了yield关键字的函数不再是函数,而是生成器。(使用了yield的函数就是生成器)
- yield关键字有两点作用:
- 保存当前运行状态(断点),然后暂停执行,即将生成器(函数)挂起
- 将yield关键字后面表达式的值作为返回值返回,此时可以理解为起到了return的作用
- 可以使用next()函数让生成器从断点处继续执行,即唤醒生成器(函数)
- Python3中的生成器可以使用return返回最终运行的返回值,而Python2中的生成器不允许使用return返回一个返回值(即可以使用return从生成器中退出,但return后不能有任何表达式)。