生成器
1 生成器定义:
在Python中,一边循环一边计算的机制,称为生成器:generator。
2 为什么要有生成器
列表所有数据都在内存中,如果有海量数据的话将会非常耗内存。
如:仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
如果列表元素按照某种算法推算出来,那我们就可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间。
简单一句话:我又想要得到庞大的数据,又想让它占用空间少,那就用生成器!
要创建一个generator,有很多种方法。
第一种方法很简单,只要把一个列表生成式的[]改成()
,就创建了一个generator:
l=[i for i in range(4)]
print(l) #[0, 1, 2, 3]
g=(i for i in range(4))
print(g) #<generator object <genexpr> at 0x01D61AB0>
创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。
方法二, 如果一个函数中包含yield
关键字,那么这个函数就不再是一个普通函数,而是一个generator。调用函数就是创建了一个生成器(generator)对象。
def gen():
i = 0
while i < 10:
j=yield 'http://page{}'.format(i*10)
if j is not None:
i=j
g=gen()
print(next(g))
print(next(g))
print(g.send(8))
print(g.send(9))
http://page0
http://page0
http://page80
http://page90
3.工作原理:
1)生成器(generator)能够迭代的关键是它有一个next()
方法,
工作原理就是通过重复调用next()方法,直到捕获一个异常。
2)带有 yield 的函数不再是一个普通函数,而是一个生成器generator。
可用next()调用生成器对象来取值。next 两种方式 t.__next__() | next(t)。
可用for 循环
获取返回值(每执行一次,取生成器里面一个值)
(基本上不会用next()来获取下一个返回值,而是直接使用for循环来迭代)。
3)yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。
4).send()
和next()
一样,都能让生成器继续往下走一步(下次遇到yield停),但send()能传一个值,这个值作为yield表达式整体的结果
——换句话说,就是send可以强行修改上一个yield表达式值。
比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10
感受下yield返回值的过程(关注点:每次停在哪,下次又开始在哪
)及send()传参的通讯过程,
思考None是如何产生的(第一次取值:yield 返回了 i 值 0,停在yield i,j没赋到值。第二次取值,开始在print,j没被赋值,故打印None,i加1,继续while判断,yield 返回了 i 值 1,停在yield i):
def gen1():
i=0
while i<5:
j=yield i
print(j)
i=i+1
g1=gen1()
print(next(g1))
print(next(g1))
print(next(g1))
print(next(g1))
print(g1.send('hello'))
0
None
1
None
2
None
3
hello
4
继续引用一个例子:
def test():
print("----start-----")
a = 0
b = 1
for i in range(14):
print("-----1------")
yield b
a,b=b,a+b
print("--------2-----")
print("--------3---------")
test()
运行完结果居然为空:
当我们执行test() 的时候是什么都打印不出来的,怎么不打印东西呢, 最起码把 start 打印出来呀。
解释如下:
test() 执行以后返回的是生成器对象,大家记住只要带 yield 都是生成器,生成器对象 你不调用是不会取值的,他只是记忆下有这个过程
取值要用next() ,我们试试下:
def test():
print("----start-----")
a = 1
b = 1
for i in range(14):
print("-----1------")
yield b*2
a,b=b,a+b
print("--------2-----")
print("--------3---------")
c=test() #什么都不输出,因为有yield,会认为是生成器,生成器对象是不调用不会取值
print(next(c)) #从开始执行到yield,返回yeild 后面整个代码块 2
print(next(c)) #从上次挂起的位置开始执行,即执行a,b=b,a+b,一直执行到下次yeild
运行结果:
----start-----
-----1------
2 # b的值取出来一个 , 当它到yield 取到值的时候就停止, 等你下次继续掉
我再用一个next()看看结果是什么?
--------2-----
-----1------
4
通过结果我们可以看出, 在yield 后边的代码继续执行 ,遇到了for循环 继续执行 然后到了yield 停止 把值返回