一、迭代器协议
1、迭代器是指:对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个Stoplteration异常,已终止迭代(只能往后走不能往前退)
2、可迭代对象:实现了迭代器协议的对象(如何实现:对象内部定义一个_iter_()方法)
3、协议是一种约定,可迭代对象实现了迭代器协议,python的内部工具。(如:for循环、sum、max函数使用迭代器协议访问对象)
二、for循环机制
for循环本质:循环所有对象,全部是使用迭代器协议(字符串、列表、元组、字典、集合、文件对象)这些都不是可迭代对象,只不过在for循环时,调用了他们内部的__iter__()方法,把他们变成了可迭代对象。
for循环调用可迭代对象的__next__方法取值,而且for循环会捕捉Stoplteration异常终止迭代。
三、迭代方式
l = ['a','b','c']
# 1、下标访问方式
print(l[0]) #a
print(l[1]) #b
print(l[3]) #超出边界报错:IndexError
# 2、遵循迭代器协议访问方式
diedai_l=l.__iter__()
print(diedai_l.__next__()) #a
print(diedai_l.__next__()) #b
print(diedai_l.__next__()) #c
print(diedai_l.__next__()) #超出边界报错:Stoplteration
# 3、for循环方式访问
for i in l #diedai_l = l.__iter__()
print(i) #i=diedai_l.next()
# 4、用while去模拟for循环做的事
diedau_l=l.__iter__()
while True:
try:
print(diedai_l.__next__())
except StopIteration:
print('迭代完毕,循环终止')
break
# 补:再有序列的如:字符、列表、元组都有下标可用1、2、4进行访问,但是非序列:字典、集合、文件对象就利用for循环进行访问
四、生成器
可以理解为是一种数据类型,它自动实现了迭代器协议(其他数据类型需要调用自己的内置函数__iter__方法),所以生成器是可迭代对象
在python中两种表达形式:
1、生成函数:常规函数定义,但是使用yield语句而不是return语句返回结果(可返回多值)yield语句一次返回一个结果,在每一个结果中间,挂起函数状态,以便下次从他离开的地方继续执行
def test():
yield 1
yield 2
g = test()
print(g.__next__()) #1
print(g.__next__()) #2
#触发生成器
def test():
yield 1
print('第一次')
yield 2
print('第二次')
t = test()
print(t.send(None)) # 1
#第一次
# 补:x = yield的另外一个特性,接受send传过来的值,赋值给x
2、生成器表达式
类似于列表推导,但是生成器返回按需求生产结果的一个对象,而不是一次构建一个结果
# 1)三元表达式
name = 'alxe'
res = 'Yes' if name=='alex' else 'NO'
print(res) #Yes
# 2)列表解析
coce_list = []
for i in rang(4)
coce_list.append('可乐%s'%i)
print(coce_list) #['可乐0','可乐1','可乐2','可乐3']
#-->用三元表达式转换
l = ['可乐%s'%i for i in rang(4)]
l1 = ['可乐%s'%i for i in rang(4) if i>2]
print(l) #['可乐0','可乐1','可乐2','可乐3']
print(l1) #['可乐3']
# 3)把列表解析式换成生成器(节省内存)
coce = ('可乐%s'%i for i in rang(4))
print(coce) #<generator object <genexpr> at 0x0000602360>
print(coce.__next__()) #可乐0
print(next(coco)) #可乐1
print(next(coco)) #可乐2
总结:
1、把列表解析的[]换成()得到的就是生成器
2、列表解析与生成器表达式是一种便利的变成方程式,只不过生成器更节省内存
3、python不仅的使用迭代器协议,让for循环变得更加通用,大部分内置函数也是使用迭代器协议访问对象,例如:sum函数
sum(x2 for x in xrang(4)) #12
而不用多此一举sum([x2 for x in xrang(4)])
优点:
1)生成器的好处是延迟计算,一次返回一个结果,也就是说他不会一次生成所有结果,这对于大数据处理将非常有用
2)生成器还能有效提高代码可读性
补:用send来实现单线程迸发