操作系统已经针对这种I/O操作进行了优化。因此,您可以直接将数字写入文件并获得非常好的速度:import tempfile, random
with tempfile.NamedTemporaryFile(delete=False) as nf:
for _ in xrange(1000000): # xrange() is more efficient than range(), in Python 2
nf.write(str(random.randint(0, 1000)))
实际上,只有当大小优化的文件缓冲区已满时,数字才会写入磁盘。在我的机器上,问题中的代码和上面的代码需要相同的时间。因此,我建议使用更简单的代码,并依赖于操作系统的内置优化。在
如果结果适合内存(即100万个数字的情况),那么您确实可以通过创建最终字符串并一次性写入来保存一些I/O操作:
^{pr2}$
在我的计算机上,第二种方法要快30%(2.6秒,而不是3.8秒),这可能要归功于一次写入调用(而不是一百万次的write()调用,而且实际的磁盘写入可能要少得多)。在
你的问题的“很多大文章”的方法处于中间(3.1秒)。不过,它还可以改进:这样写会更清晰、更像Python:import tempfile, random
with tempfile.NamedTemporaryFile(delete=False) as nf:
for _ in xrange(1000):
nf.write(''.join(str(random.randint(0, 1000)) for _ in xrange(1000)))
这个解决方案相当于,但比原问题中的代码更快(在我的机器上是2.6秒,而不是3.8秒)。在
总之,上面第一个简单的方法对您来说可能已经足够快了。如果不是,如果整个文件都可以放入内存,那么第二种方法既快速又简单。否则,您最初的想法(更少的写入,更大的块)是好的,因为它与“单次写入”方法一样快,而且在上面写的时候仍然非常简单。在