5.python迭代器和生成器

1.1.概念

 迭代器协议

  • 迭代器协议:对象需要提供next方法,它要么返回迭代中的下一项,要么引起一个StopIteration异常,以终止迭代
  • 可迭代对象:实现了迭代器协议的对象

 迭代器

  • 迭代器和以下标的访问方式不一样,迭代器是不能返回的(比如下标方式 list[2],之后可以访问list[0],list[1],只能__next__),迭代器提供了一种惰性方式获取数据(就是只有在访问数据的时候才去计算或者说才去获取数据)

生成器

  • python使用生成器对延迟操作提供了支持,所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。

生成器函数

  • 与常规函数不同的是:使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数,下次执行的时候,从上一次挂起地方开始。

生成器表达式

  • 返回的是一个生成器对象,这个对象只有在需要的时候才产生结果

1.2. 迭代器必须实现iter()方法

Python中 list,tuple,str,dict这些都可以被迭代,但他们并不是迭代器。为什么?

因为和迭代器相比有一个很大的不同,list/tuple/map/dict这些数据的大小是确定的,也就是说有多少是可知的。但迭代器不是,迭代器不知道要执行多少次,所以可以理解为不知道有多少个元素,每调用一次next(),就会往下走一步,是惰性的。

Iterable:判断是不是可以迭代

Iterator:判断是不是迭代器

iterable —— 只实现了__iter__的对象; 
iterator —— 同时实现了__iter__和__next__方法的对象。

from collections import Iterable,Iterator

a = [1,2,]

print(isinstance(a,Iterable))    #True    list是可迭代的
print(isinstance(a,Iterator))    #False   list不是迭代器

 通过iter()方法,获取iterator对象

from collections import Iterable,Iterator

a = [1,2,]

iter_rator = iter(a)
print(isinstance(iter_rator,Iterator)) # True 迭代器
print(isinstance((x for x in range(10)),Iterator)) #True

# 总结
# 凡是可以for循环的,都是Iterable
# 凡是可以next()的,都是Iterator
# list,truple,dict,str,都是Itrable不是Iterator,
# 但可以通过iter()函数获得一个Iterator对象

1.3.自定义迭代器

通过自定义一个迭代器,进一步说明什么是迭代器,什么是可迭代对象

对象包含_iter_()或者_getitem_()就是一个可迭代对象。

迭代器:对可迭代对象使用_iter_方法就可以得到一个迭代器,要使迭代器指向下一个元素可以使用next(),迭代器是一次性,迭代不可逆,一旦没有元素迭代了就会抛出stopIteration异常

from collections import Iterator

# 自定义迭代器
class MyIterator(Iterator):  # 如果不继承Iterator,则必须实现__iter__方法
    def __init__(self, employee_list):
        self.iter_list = employee_list
        self.index = 0  # 初始化索引位置

    def next(self):
        # 真正返回迭代值的逻辑
        try:
            word = self.iter_list[self.index]
        except IndexError:
            raise StopIteration
        self.index += 1
        return word

class Company(object):
    def __init__(self, employee_list):
        self.employee = employee_list

    def __iter__(self):
        return MyIterator(self.employee)

if __name__ == "__main__":
    company = Company(["derek1", "derek2", "derek3"])
    my_itor = iter(company)

    print(next(my_itor))  # derek1
    print(next(my_itor))  # derek2
    print(next(my_itor))  # derek3

    for item in company:
        print (item)  # derek1  derek2  derek3

 1.4.生成器函数的使用

 (1)生成器函数和普通函数的区别

#函数里只要有yield关键字,就是生成器函数
def gen_func():
    yield 1

def func():
    return 1

if __name__ == '__main__':
    gen = gen_func()
    print(type(gen)) #<type 'generator'> 返回的是一个生成器对象

    res = func()
    print(type(res)) #<type 'int'> 返回1

 (2)取出生成器里面的值

#函数里只要有yield关键字,就是生成器函数
def gen_func():
    yield 1
    yield 2
    yield 3

if __name__ == '__main__':
    gen = gen_func()
    print(type(gen)) #<class 'generator'> 返回的是一个生成器对象
    
    for value in gen:
        print(value) # 1,2,3

 (3)斐波那契的例子

def fib(index):
    re_list = []
    n,a,b = 0,0,1
    while n < index:
        re_list.append(b)
        a,b = b, a+b
        n += 1
    return re_list

print(fib(10))    #[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

假如当数据量非常大的时候,这样全部打印会消耗非常大的内存,下面使用yield,虽然同样是获取数据,但是它实际上是不消耗内存的

def gen_fib(index):
    n,a,b = 0,0,1
    while n < index:
        yield b       
        a,b = b, a+b
        n += 1

for data in gen_fib(10):
    print(data)   # 1, 1, 2, 3, 5, 8, 13, 21, 34, 55

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值