一、迭代和可迭代对象
迭代(Iteration):迭代就是遍历,遍历就是将序列按照顺序一个一个输出
可迭代对象(Iterable):可以迭代的对象就是可迭代对象。或者是能作用于 for
循环之上的对象就是可迭代对象
二、迭代器
1. 为什么要用迭代器?
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为迭代器(Iterator)。
要获取迭代器的值需要通过next()函数,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的异常。
简单来说,list保存的是数据,而迭代器保存的是算法
2. 迭代器(Iterator):
接下来就给迭代器下一个定义:
能作用于 next()
函数之上的可迭代对象就是迭代器
由于可迭代对象是能作用于 for
循环之上的,所以,迭代就是能作用于for
和next()
之上
3. 如何创建迭代器
Python 提供了一个将普通的可迭代对象转为迭代器的函数 iter(),它的返回值就是一个迭代器
4. 用户如何自定义迭代器
那么,除了语言本身的序列可以转为迭代器,用户如何自定义迭代器呢?
用户如果自定义迭代器,需要在自己定义的类中加入 __iter__()
和 __next__()
方法
三、生成器 generator
1. 创建生成器
到此为止,我们学习了Python中强大的迭代器,可以只占用一点内存实现大量序列的存储。
但是有一点不是很友好,就是用户自定义的迭代器很是麻烦,需要定义两个方法。有时候我只需实现一些很小的功能,不需要写类,一个简单的函数就可以搞定。那么有没有一种方式,可以实现呢?
有!!!
就是将普通函数中加上 yield,这时它就是一个迭代器了。
其实生成器本质也是迭代器,只不过是一种特殊的迭代器。但是为了区分和普通迭代器的区别,要给它起一个高大上的名字,生成器!以后只要遇到在函数中加上 yield 方法的迭代器都称之为生成器 generator,也可以查询类型的时候 type()
yield 可以将程序暂停,下次再调用函数的时候从 yield 下方开始执行
2. 生成器推导式
生成器的好处就是用户自定义迭代器的时候不需要写类了,但是有些人还是懒得写函数,那么有没有一种不需要写函数的迭代器吗?类型函数中有匿名函数,一行就搞定!
呃。。。没有嘛?NO,当然有!!!世界进步就是因为人的懒来推动的。
除了在函数中加上 yield 外,还有一种方式可以实现,在实现之前我们先看几个推导式
####(1)列表推导式
[i for i in [1, 2, 3, 4, 5]]
(2)字典推导式
{i: j for i in [1, 2, 3, 4, 5] for j in 'abcde'}
(3)集合推导式
{i for i in [1, 2, 3, 4, 5]}
集合推导式和字典推导式就是看{}中有几个值,有没有:
(4)字符串推导式
那有没有字符串推导式呢?字符串推导式是引号开头的,我们可以试试
"i for i in 'abcde'"
输出发现还是字符串,因为字符串第一条铁律是包含在引号内的都是字符串
(5)数字推导式
当然也没有数字推导式了,定义数字是什么都不加,如果写成下面这样是会爆语法错误的
i for i in 12345
而且针对不可变类型的数据类型推导式是毫无意义的,因为不可变类型的值一旦改变,他的指针也会改变,它的对象已经改变了
(6)元组推导式
最后再看下元组推导式,元组当然是用括号表示
(i for i in [1, 2, 3, 4, 5])
whit?mounty fuck!怎么回事?为什么元组有推导式呢?
仔细看它的类型是generator,这么熟悉,这不就是我们刚刚学习的生成器吗?
对嘞!这是创建生成器的另一种方法,是不是和匿名函数很像呢?我们可以给它起个名字:生成器推导式
四、扩展
当然生成器这么高大上的名字,也不单单只是为了简化迭代器的,正是因为有生成器的存在,我们可以写协程程序,什么是协程呢?且听下回分解!
五、总结
迭代:遍历
可迭代对象:能作用于for之上的
迭代器:保存算法,能作用于 next() 之上的
创建迭代器:2种方式。1.iter() 2.类中包含 __iter__()
和 __next__()
生成器:是一种特殊的迭代器
创建生成器:2种方式。1.函数中包含 yield 2.生成器推导式