什么是迭代器
本文参考了部分大佬的文章哦:零基础学python
迭代器就是一个可以让程序员遍历(特别是列表)的对象,然而一个迭代器在遍历并读取一个容器的数据元素时,并不会执行一个迭代。我们先来理解这三方面内容:
- 可迭代对象
- 迭代器
- 迭代
可迭代对象
只要一个对象定义了可以返回一个迭代器的__iter__方法,或是定义了支持下标索引的__getitem__方法,那么他就是一个可迭代对象
那些类型是list、tuple、file、dict对象有__iter__()方法,标着他们能够迭代。
如何判断一个对象是不是可迭代对象
"""
我们已经知道可以对list、tuple、str等类型的数据使⽤for...in...的循环语法从其中依次拿到数据进⾏使
⽤,我们把这样的过程称为遍历,也叫迭代isinstance
"""
# 可迭代对象的本质就是:
# ⼀个对象所属的类中含有 __iter__() ⽅法,该对象就是⼀个可迭代对象
from collections.abc import Iterable
print(isinstance([1, 2, 3], Iterable))
class MyClass():
# 该魔术方法就是一个迭代器
def __iter__(self):
pass
obj = MyClass()
print(isinstance(obj, Iterable))
print(isinstance(10, Iterable))
True
True
False
Process finished with exit code 0
迭代器
只要一个对象,定义了__next__方法,那么他就是一个迭代器
迭代
就是从某个地方(比如列表)取出一个元素的过程。当我们使用一个循环来遍历某个东西的时候,这个过程就是迭代
使用迭代器自定义列表
# 自定义列表
# 全局变量要在初始化方法中进行定义
from collections.abc import Iterable
# 自定义数组类
class MyList(object):
def __init__(self):
self.items = []
def __iter__(self):
# 可迭代就必须返回迭代器对象,此时我们已新建迭代器类,进行实例化对象即可
mylistiterator = MyListIterator(self.items)
return mylistiterator
def addItem(self, data):
# 追加保存数据
self.items.append(data)
# 自定义迭代器类
class MyListIterator(object):
def __init__(self, item):
self.mylist = item
self.current_index = 0
def __iter__(self):
pass
def __next__(self):
# 获取下一个元素时进行判断,是否下标越界
if self.current_index < len(self.mylist):
data = self.mylist[self.current_index]
self.current_index += 1
return data
# 先return后面的代码就不执行啦
else:
raise StopIteration
if __name__ == '__main__':
mylist = MyList()
mylist.addItem("张飞")
mylist.addItem('关羽')
mylist.addItem('刘备')
for value in mylist:
print(value)
print(isinstance(mylist, Iterable))
张飞
关羽
刘备
True
Process finished with exit code 0
迭代器案例(斐波那契数列)
class Fibonacci(object):
# 这是一个迭代器类,有两个方法iter和next
def __init__(self, num):
self.num = num
self.a = 1
self.b = 1
self.current_index = 0
def __iter__(self):
# 返回迭代器对象,通常是他自己
return self
def __next__(self):
# 在生成下一个数之前进行判断。
if self.current_index <= self.num:
self.a, self.b = self.b, self.a + self.b
self.current_index += 1
return self.a
else:
raise StopIteration
if __name__ == '__main__':
fibonacci = Fibonacci(5)
for value in fibonacci:
print(value)
1
2
3
5
8
13
Process finished with exit code 0
什么是生成器
生成器也是一种迭代器,但是你只能对其迭代一次。这是因为它们并没有把所有的值存在内存中,而是在运行时生成值。你通过遍历来使用它们,要么用一个“for”循环,要么将它们传递给任意可以进行迭代的函数和结构。大多数时候生成器是以函数来实现的。然而,它们并不返回一个值,而是yield(暂且译作“生出”)一个值。这里有个生成器函数的简单例子:
def generator_function():
for i in range(10):
yield i
for item in generator_function():
print(item)
# Output: 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9
这个案例并不是非常实用。生成器最佳应用场景是:你不想同一时间将所有计算出来的大量结果集分配到内存当中,特别是结果集里还包含循环。
注:这样做会消耗大量资源
许多Python 2里的标准库函数都会返回列表,而Python 3都修改成了返回生成器,因为生成器占用更少的资源。
下面是一个计算斐波那契数列的生成器:
# generator version
def fibon(n):
a = b = 1
for i in range(n):
yield a
a, b = b, a + b
for x in fibon(1000000):
print(x)
next函数
def generator_function():
for i in range(3):
yield i
gen = generator_function()
print(next(gen))
# Output: 0
print(next(gen))
# Output: 1
print(next(gen))
# Output: 2
print(next(gen))
# Output: Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# StopIteration
我们可以看到,在yield掉所有的值后,next()触发了一个StopIteration的异常。基本上这个异常告诉我们,所有的值都已经被yield完了。你也许会奇怪,为什么我们在使用for循环时没有这个异常呢?啊哈,答案很简单。for循环会自动捕捉到这个异常并停止调用next()。你知不知道Python中一些内置数据类型也支持迭代哦?我们这就去看看:
my_string = "Yasoob"
next(my_string)
# Output: Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# TypeError: str object is not an iterator
好吧,这不是我们预期的。这个异常说那个str对象不是一个迭代器。对,就是这样!它是一个可迭代对象,而不是一个迭代器。这意味着它支持迭代,但我们不能直接对其进行迭代操作。那我们怎样才能对它实施迭代呢?是时候学习下另一个内置函数,iter。它将根据一个可迭代对象返回一个迭代器对象。这里是我们如何使用它:
my_string = "Yasoob"
my_iter = iter(my_string)
next(my_iter)
# Output: 'Y'
生成器案例(斐波那契数列)
def Fibonacci(n):
a = 1
b = 1
current_index = 0
while current_index < n:
a, b = b, a + b
current_index += 1
xxx = yield a
# yield返回a的值,保存程序状态,回来可继续执行next将其唤醒
print('aaaa')
# 生成器能使用return,结束生成器运行
if xxx == 1:
return 'aini'
if __name__ == '__main__':
fabonacci = Fibonacci(5)
print(next(fabonacci))
# for value in fabonacci:
# print(value)
try:
print(next(fabonacci))
#send唤醒生成器执行,并将传递给xxx
print(fabonacci.send(1))
except StopIteration as e:
print(e.value)
1
aaaa
2
aaaa
aini
Process finished with exit code 0
生成器是一种用普通函数语法定义的迭代器。通过上面的例子可以看出,这个生成器(也是迭代器),在定义过程中并没有像上节迭代器那样写__inter__()和next(),而是只要用了yield语句,那个普通函数就神奇般地成为了生成器,也就具备了迭代器的功能特性。