python中for..in语法的原理?

今天发现了python中一个比较有意思的小设计。

如果要通过中括号[]访问元素,需要重写__get__item()函数,这个应该没什么疑问,测试代码如下:

class Classroom:
    def __init__(self, students):
        self.students = students

    def __getitem__(self, sid):
        for s in self.students:
            if s.sid == sid:
                return s

    def __len__(self):
        return len(self.students)


class Student:
    def __init__(self, sid, name):
        self.sid = sid
        self.name = name

    def __repr__(self):
        return str.format("sid: {}, name: {}", self.sid, self.name)


if __name__ == '__main__':
    class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
    print(class_room[12])

通过中括号加学号的方式,可以获得对应学号的学生,代码顺利执行,没问题。

在我想要用for...in迭代时

if __name__ == '__main__':
    class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
    for student in class_room:
        print(student)

出现了问题,进入了死循环,控制台打印出迭代到的值一直是None

当我换一种写法时,就可以遍历成功了

但这么做有个问题,sid就不是学号了,而是students数组的下标,这和业务的语义是不相符的。但是我们先不忽略这一点,研究下for in到底是怎么实现的。

以Java为例,需要通过迭代器来迭代集合元素,集合元素通过next()方法获取元素,通过hasNext()方法探测迭代的终点。

那么python是如何只通过一个函数就能实现迭代的呢?

先说结论:从下标0开始迭代,直到__getitem__函数抛出IndexError异常。

for in刚开始迭代时,固定给getitem函数传了0,随后从0开始递增。

如果判断正确,students[sid],在迭代三次后,应该会抛出数组越界的异常IndexError,所以我怀疑可能是解释器把捕捉到IndexError异常作为了迭代终止的条件。(经过测试,只有IndexError会正常退出循环,其他类型的异常会直接显示报错)

 修改代码,在第10次循环时,抛出异常

果然循环停止了,控制台打印结果:

再补充一点,通过iter函数以及next函数来迭代时,最终也是调用了getitem方法,下标也是从0开始。

if __name__ == '__main__':
    class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
    # for student in class_room:
    #     print(student)

    stu_iter = iter(class_room)
    print(next(stu_iter))
    print(next(stu_iter))
    print(next(stu_iter))

 

如有错误,欢迎指正。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值