所以我认为如果我在迭代器中运行我的程序直到10000个元素,然后保存它的状态,那就更好了。下次运行程序时,它将从迭代器中的10001元素继续运行。
你很幸运,因为
itertools.combinations_with_replacement
对象具有允许设置状态的API。它被
copy
在python中使用模块,但是没有理由不能同时钩住。
例如10001
钍
项目如下:
>>> all_possible = itertools.combinations_with_replacement(POSSIBLE_CHARS, 29)
>>> for i in range(10_000):
... next(all_possible)
...
>>> "".join(next(all_possible))
'aaaaaaaaaaaaaaaaaaaaaaaaaafwI'
要在新实例中“快速前进”到此项,它将是:
>>> new_iterator = itertools.combinations_with_replacement(POSSIBLE_CHARS, 29)
>>> state = (0,)*26 + (5, 22, 33)
>>> new_iterator.__setstate__(state)
>>> "".join(next(new_iterator))
'aaaaaaaaaaaaaaaaaaaaaaaaaafwI'
>>> "".join(next(new_iterator))
'aaaaaaaaaaaaaaaaaaaaaaaaaafwJ'
>>> new_iterator.__setstate__(state) # bonus: rewind iterator!
>>> "".join(next(new_iterator))
'aaaaaaaaaaaaaaaaaaaaaaaaaafwI'
为了理解为什么组合10001对应于长度为29的某个元组(0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、5、22、33),我邀请您浏览cpython源代码。
to see how combinations objects allow themselves to be statefully copied
以及
pickle
docs
.
如果您不需要针对错误或恶意构造的数据提供安全性,那么您可以考虑简单地pickle这样的迭代器来归档,而不是钩住
__setstate__
方法。