python 迭代器&生成器

在了解这个内容之前我们需要先了解一下列表生成式

列表生成式

通过列表生成式,我们可以直接创建一个列表。

L =[i*2 for i in range(5)]
print(L)
# 运行结果:[0, 2, 4, 6, 8]

但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,占用的存储空间也很大,如果我们大多是时候只要访问前面几个元素,偶尔访问后面的元素,那对于性能并不是很友好。

生成器(Generator)

所以,如果列表元素可以按照某种规则推算出来,那么我们不必创建一个完整的list。在Python中,这种一边循环一边计算的机制,称之为生成器

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

g = (x * x for x in range(10))
print(g)
# 运行结果:
# <generator object <genexpr> at 0x00000049733883B8>

# generator有next()获取元素值,但基本上永远不会调用next()方法,而是通过for循环来迭代它。
for i in g :
    # 注释
    print(i)
# 运行结果:
# 0
# 1
# 3
# 9
# ...

个人理解列表生成器会在编译的时候就生成好完整的数据,而生成器编译的时候只会返回一个内存地址,我们调用的时候才会生成相应的数据

通过上面的例子可能会让我们以为生成器是一个表达式,其实python其提供了两种表达方式

  • 生成器表达式:返回一个对象,这个对象只有在需要的时候才产生结果
  • 生成器函数:也是用def定义的,利用关键字yield一次性返回一个结果,阻塞,重新开始

生成器函数普通函数的区别在于,一般的函数在执行完毕之后会返回一个值然后退出,但是生成器函数会自动挂起,然后重新拾起继续执行,他会利用yield关键字关起函数,给调用者返回一个值,同时保留了当前的足够多的状态,可以使函数继续执行

# 函数有了yield之后,函数名+()就变成了生成器
# return在生成器中代表生成器的中止,直接报错
def consumer(name):
    print('%s,准备吃包子了' % name)
    while True:
        baozi = yield
        print("%s馅儿的" % baozi)


c = consumer('Victor')  # 创建生成器,返回 对象地址
c.__next__()  # next 第一次调用会在 yield 前面停止
# 运行结果:Victor,准备吃包子了
c.send('韭菜')  # send 作用是唤醒并继续执行,同时传一个值到生成器内部  yield 接收
# 运行结果:韭菜馅儿的
c.__next__() # next 作用是唤醒并继续执行
# 运行结果:None馅儿的

迭代器

可以直接作用于for 循环的对象统称为可迭代对象:Iterable;我们已经知道,可以直接作用于for循环的数据类型有以下几种:

  • 一类是集合数据类型,如list,tuple,dict,set,str等
  • 一类是generator,包括生成器和带yield的generator function

可以使用isinstance()判断一个对象是否为可Iterable对象,如下:

from collections import Iterable
# 判断是否可迭代
print(isinstance([], Iterable)) # Iterable 可迭代的
# 结果:True
print(isinstance((x for x in range(10)), Iterable))
# 结果:True
print(isinstance(100, Iterable))
# 结果:False

可以被next()函数调用并不断返回下一个值的迭代对象称为迭代器:Iterator。

生成器都是Iterator对象(迭代器),但list、dict、str虽然是Iterable(可迭代对象),却不是Iterator(迭代器)。

  • 把list、dict、str等Iterable变成Iterator可以使用iter()函数:
from collections import  Iterable
from collections import Iterator
# 判断是为迭代器
print(isinstance(iter([]), Iterator))
# 结果:True
print(isinstance(iter('abc'), Iterator))
# 结果:True

小结:

  • 凡是可作用于for循环的对象都是Iterable【可迭代】类型;
  • 凡是可作用于next()函数的对象都是Iterator【迭代器】类型,它们表示一个惰性计算的序列;
  • 集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。

更多内容参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值