这一节来学习生成器(generator)和迭代器(iterator)
首先来回忆一个例子,这里打印rest的时候为什么要通过list(rest)打出,而不是直接输出rest?
>>> li=[11,22,33]
rest=filter(lambda x:x>22,li)
print(list(rest))
--------
[33]
试试看,如果直接输出是什么结果?>>> li=[11,22,33]
rest=filter(lambda x:x>22,li)
print(rest)
事实上,如果在2.7里面,他会直接输出结果,但是在3.X以后,他只会返回一个具有生成能力的对象,而不是直接输出所有结果,这样的好处是如果我们有成千上万个数据要输出,他不会直接一股脑的就输出来了。我们需要循环地输出这个对象生成所有需要的值。比如把上面的例子改成for循环也是一样的>>> li=[11,22,33]
rest=filter(lambda x:x>22,li)
for i in rest:
print(i)
33
现在来看看基本的定义:
1.迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。另外,迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件
特点:访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
不能随机访问集合中的某个值 ,只能从头到尾依次访问
访问到一半时不能往回退
便于循环比较大的数据集合,节省内存
2. 一个函数调用时返回一个迭代器,那这个函数就叫做生成器(generator);如果函数中包含yield语法,那这个函数就会变成生成器;
下面直接通过例子说明:
比如我定义了一个函数f1,里面包含了yield这个关键字,那么他就变成了一个生成器,他的结果只能通过迭代器的next方法一步步输出>>> def f1():
print("1")
yield 22
print("2")
yield 33
print("3")
yield 44
r=f1()
print(r,type(r))
print(r.__next__())
print(r.__next__())
print(r.__next__())
--------------------
1
22
2
33
3
当然通过循环语句自动调用迭代器更方便了for item in r:
print(item)
例2 通过生成器做一个range的函数>>> def nrange(num):
temp = -1
while True:
temp = temp + 1
if temp >= num:
return
else:
yield temp
r=nrange(5)
print(r)
for item in r:
print(item)
---------------------
0
1
2
3
4
再看个例子def split_line():
print ('ready to split')
result="4 5 6"
while True:
line=yield result
result=line.split()
s=split_line()
s.__next__()
#send的值去替换掉line的值,返回值是result
ret=s.send('1 2 3')
print(ret)
ret=s.send('a b c')
print(ret)
"C:\Program Files\Python3\python.exe" C:/Users/yli/pycharmprojects/Exercise/Week12/test.py
ready to split
----------
['1', '2', '3']
['a', 'b', 'c']