在python中怎样去使用生成器与yield函数(一)迭代器

使用迭代器

迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。

可迭代对象

我们已经知道可以对list、tuple、str等类型的数据使用for…in…的循环语法从其中依次拿到数据进行使用,我们把这样的过程称为遍历,也叫迭代,这个数据就是可迭代的。

>>> alist=[1,2,3,4,5]
>>> for ele in alist:
	print(ele)
	
1
2
3
4
5

但是,是否所有的数据类型都可以放到for...in...的语句中,然后每次从中取出一条数据供我们使用,即供我们迭代吗?
我们可以用isinstance()语句来判断:

>>> isinstance({},Iterable)
True
>>> isinstance('abc',Iterable)
True
>>> isinstance(100,Iterable)
False

返回值为True的数据为可迭代的,为False的为不可迭代的。
那么我们要怎样来构造一个迭代器呢?
参考一下python迭代器协议的定义。

含有 __ iter __() 方法或 __ getitem __() 方法的对象称之为可迭代对象

因此,我们可以重写__iter__()方法来自定义一个迭代器类。

>>> class MyList(object):
    def __init__(self):
        self.container = []

    def add(self, item):
        self.container.append(item)

    def __iter__(self):
        """返回一个迭代器"""
        # 我们暂时忽略如何构造一个迭代器对象
        pass
>>> isinstance(MyList(),Iterable)
True

可以看到MyList类的对象已经是一个可迭代的了。

迭代过程的本质

当然,仅凭上面的代码还是无法进行迭代的。如下:

>>> mylist=MyList()
>>> mylist.add(1)
>>> mylist.add(2)
>>> mylist.container
[1, 2]
>>> for i in mylist:
	print(i)
		
Traceback (most recent call last):
  File "<pyshell#14>", line 1, in <module>
    for i in mylist:
TypeError: iter() returned non-iterator of type 'NoneType'

错误提示表示没有返回一个迭代器对象,说明我们还需要一个迭代器对象,那么是时候分析迭代的过程了。在数据迭代的过程中,我们存在一个工具来帮我们标记现在遍历的位置,直到数据被迭代完成。这个工具就是我们的迭代器 (Iterator)可迭代对象的本质就是可以向我们提供一个这样的中间“人”即迭代器帮助我们对其进行迭代遍历使用。
实际上就是,可迭代对象通过__iter__()方法,向我们提供了迭代器。然后利用迭代器,我们再对对象进行迭代。在for x in something:语句中,我们首先调用something__iter__()方法来获取到一个该对象的迭代器,而后for循环会调用迭代器的__next__()方法,获取迭代器的下一个对象,赋值给x。

迭代器

显然,在迭代的过程中,迭代器是必不可少的,同样的我们也可以自定义一个迭代器。python迭代器协议中规定:

迭代器协议(iterator protocol)是指要实现对象的__iter()__ 和 next() 方法(注意:Python3 要实现__next__() 方法),其中,__iter __() 方法返回迭代器对象本身,next() 方法返回容器的下一个元素,在没有后续元素时抛出 StopIteration 异常。

所以,我们需要重写两个方法,一个是__iter__(),一个是__next__()方法。并且可迭代对象的__iter__()方法要返回我们的迭代器。

class MyList(object):
    """自定义的一个可迭代对象"""
    def __init__(self):
        self.items = []

    def add(self, val):
        self.items.append(val)

    def __iter__(self):
    	#返回迭代器
        myiterator = MyIterator(self)
        return myiterator


class MyIterator(object):
    """自定义的供上面可迭代对象使用的一个迭代器"""
    def __init__(self, mylist):
        self.mylist = mylist
        # current用来记录当前访问到的位置
        self.current = 0

    def __next__(self):
        if self.current < len(self.mylist.items):
            item = self.mylist.items[self.current]
            self.current += 1
            return item
        else:
            raise StopIteration

    def __iter__(self):
        return self

使用for...in来测试一下:

mylist = MyList()
    mylist.add(1)
    mylist.add(2)
    mylist.add(3)
    for num in mylist:
        print(num)

结果为:

1
2
3

其实还可以这样来遍历:

    mylist = MyList()
    mylist.add(1)
    mylist.add(2)
    mylist.add(3)
    iterator=MyIterator(mylist)
    while(1):
        try:
            a=iterator.__next__()
            print(a)
        except StopIteration:
            break

返回的结果都是一样的,这也说明在for ...in ...中隐性地调用了迭代器,并且将调用了__next__()方法赋值给循环元素。

参考文章

Python 中的黑暗角落(一):理解 yield 关键字

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

weixin_42193538

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值