艺赛旗 RPA10.0全新首发免费下载 点击下载
www.i-search.com.cn/index.html?from=line1
0 前言
说到处理循环,我们习惯使用 for, while 等,比如依次打印每个列表中的字符:
lis = [‘I’, ‘love’, ‘python’]
for i in lis:
print(i)
输出:
I
love
python
在打印内容字节数较小时,全部载入内存后,再打印,没有问题。可是,如果现在有成千上百万条车辆行驶轨迹,叫你分析出其中每个客户的出行规律,堵车情况等,假如是在单机上处理这件事。
你可能首先要面临,也可能被你忽视,最后代码都写好后,才可能暴露出的一个问题:outofmemory, 这在实际项目中经常遇到。
这个问题提醒我们,处理数据时,如何写出高效利用内存的程序,就显得很重要。今天,我们就来探讨如何高效利用内存,节省内存同时还能把事情办好。
其实,Python 已经准备好一个模块专门用来处理这件事,它就是 itertools 模块,这里面几个函数的功能其实很好理解。
我不打算笼统的介绍它们所能实现的功能,而是想分析这些功能背后的实现代码,它们如何做到高效节省内存的,Python 内核的贡献者们又是如何写出一手漂亮的代码的,这很有趣,不是吗?
1 拼接元素
itertools 中的 chain 函数实现元素拼接,原型如下,参数 * 表示个数可变的参数
chain(iterables)
应用如下: