迭代器(iterator):
一、什么是迭代器:
1.迭代器是实现了next()方法的可迭代对象。
2.迭代器是一种访问集合元素的一种方式,迭代器有两个基本方法next()、iter()
二、迭代器的实现原理:
1.基于上一次的执行结果,继续执行,迭代器每次输出的结果,都跟上一次的执行结果关联。
2.迭代器会从集合的第一个元素访问,迭代器只能向前访问,不能后退。
3.迭代器处理数据时,会采用”流“的形式进行处理。
二、什么是可迭代对象(iterable):
1. 可迭代对象的特征是有一个“iter”函数。对象的“iter”函数被调用后,会返回一个迭代器。查看可迭代对象内置函数的方法为print(dir(“对象名”))。
2. 可迭代对象可使用常规的for循环进行遍历。
3. 可迭代对象可以是文件
四、迭代器的优缺点:
优点:
1.可以对没有索引的对象进行遍历取值
2.节约内存,使用迭代器的时候不会将可迭代对象的所有内容全部提取出来,而是采取“流”形式对数据进行处理,即边读边取。如:在进行大文件读取时,如果直接将文件中的内容全部读取出来,被取出来的内容就会占用内存,如果文件过大,那么就可能会导致内存溢出;我们在处理大文件时,通常会使用迭代器,值得一提的是,with open方法,会自动使用迭代器。使用迭代器后,会保证取出的内容占用的内存始终不会改变,在边读边存的过程中,先读取出的内容在后续内容被读取时,会从内存中被释放出来。所以不会导致内存溢出。
缺点:
1.迭代器无法按照指定索引获取值
2.迭代器获取数据只能向前获取,不能后退
3.迭代器不触发 StopIteration 异常,就不会停止
五、定义一个简单的迭代器(引用菜鸟教程demo)
补充:
1.for循环,本质上也是一个迭代器
2.StopIteration 异常用于标识迭代的完成,防止出现无限循环的情况,在 next() 方法中我们可以设置在完成指定循环次数后触发 StopIteration 异常来结束迭代。
生成器(generator):
一、什么是生成器:
使用了yield的函数被成为生成器,生成器是一个返回迭代器的函数,生成器就是一个迭代器,而迭代器不一定是生成器。
二、生成器的作用:
1.生成器适合处理大批量的数据,生成器一次返回一个结果,而不是返回所有的结果
2.让代码更简洁。
三、定义一个简单的生成器(借鉴:https://blog.csdn.net/a200822146085/article/details/89388362的案例):