python iterator实现_Python中迭代器的实现

最新推荐文章于 2023-03-31 15:15:49 发布

北极的北极熊

最新推荐文章于 2023-03-31 15:15:49 发布

阅读量100

点赞数

文章标签： python iterator实现

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29711757/article/details/113962038

版权

问题是在Python中进行循环的时候产生的，熟悉Python的都知道，它没有类似其它语言中的for循环, 只能通过for in的方式进行循环遍历。

最典型的应用就是通过range函数产生一个列表，然后用for in进行操作，如下:

代码如下:#!/usr/bin/env python

for i in range(10):

print i

代码的意义很好理解，range会产生一个列表，用for in最这个列表进行遍历，就有和类似for

代码如下:测试代码占用内存

range(100) 2.0MB

range(10000) 2.2MB

range(100000) 3.8MB

range(1000000) 19.5MB

range(10000000) 168.5MB

range(100000000) 1465.8MB

可以看到，随着基数的加大，占用内存呈几何倍数增加，显然在进行大循环操作的时候，要避免使用range。

为了解决上述问题，python提供了另外一个函数xrange，这个函数和range非常相似，但是占用内存比range会小很多，相关的说明可以查看这里，经过测试，用xrange产生的对象，不管参数是多少，占用内存几乎都没有变化。问题又来了，xrange内部是如何实现的，为什么和range性能相差这么大？为了验证我的猜想，先尝试用python实现类似xrange的函数zrange:

代码如下:#!/usr/bin/env python

class zrange(object):

def __init__(self,stop):

self.__pointer=0

self.stop=stop

def __iter__(self):

return self

def next(self): #python3.0中，改用__next__

if self.__pointer >= self.stop:

raise StopIteration

else:

self.__pointer = self.__pointer 1

return self.__pointer-1

test = zrange(10000000)

for i in test:

print i

运行的结果和xrange一样, 对zrange进行内存占用测试，发现和xrange一样，参数的大小对内存占用几乎没有影响。那么它和range的区别在哪里呢？

前面说到，range产生的是一个列表，而无论是自定义的zrange还是系统内置的xrange产生的都是一个对象，像xrange或者zrange产生的对象，就叫做可迭代对象, 它给外部提供了一种遍历其内部元素，而不用关心其内部实现的方法。上面zrange的实现中, 最关键的实现是建立了一个内部指针__pointer, 它记录当前的访问的位置, 下次的访问就可以通过指针的状态进行相应的操作。

Python或者其它语言中，还有很多类似通过迭代的方式访问对象内容的，如读取一个文件中的内容:

代码如下:#!/usr/bin/env python

f = open('zrange.py','r')

while True:

line = f.readline()

if not line:

break

print line.strip()

f.close()

大家都知道用readline要比reandlines节省资源，其实readline和readlines就类似于xrange和range，一个是通过指针记录当前位置，下次访问把指针往前移动一个单位，另外一个是直接把所有内容存放到内存当中。文件操作函数中，还可以通过seek手动的调整指针的位置，从而达到跳过或者重复读取某些内容的目的。

可以说，迭代器的实现中，其内部指针是节省资源，让迭代正常运行的关键。

北极的北极熊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python iterator实现_Python中迭代器的实现

问题是在Python中进行循环的时候产生的，熟悉Python的都知道，它没有类似其它语言中的for循环, 只能通过for in的方式进行循环遍历。最典型的应用就是通过range函数产生一个列表，然后用for in进行操作，如下:代码如下:#!/usr/bin/envpythonforiinrange(10):printi代码的意义很好理解，range会产生一个列表，用for in最这个列...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。