操作系统已针对此类I / O操作进行了优化.因此,您可以直接将数字写入文件并获得非常好的速度:
import tempfile, random
with tempfile.NamedTemporaryFile(delete=False) as nf:
for _ in xrange(1000000): # xrange() is more efficient than range(), in Python 2
nf.write(str(random.randint(0, 1000)))
实际上,只有在大小优化的文件缓冲区已满时,才会将数字写入磁盘.问题中的代码和上面的代码在我的机器上同时进行.所以,我建议使用我更简单的代码并依赖操作系统的内置优化.
如果结果适合内存(这是100万个数字的情况),那么你确实可以通过创建最终字符串然后一次性写入来保存一些I / O操作:
with tempfile.NamedTemporaryFile(delete=False) as nf:
nf.write(''.join(str(random.randint(0, 1000)) for _ in xrange(1000000)))
第二种方法在我的计算机上快了30%(2.6秒而不是3.8秒),这可能要归功于单次写入调用(而不是一百万次write()调用 – 实际磁盘写入可能要少得多).
你的问题的“许多大写”方法落在中间(3.1秒).但它可以改进:它更清晰,更Pythonic写这样:
import tempfile, random
with tempfile.NamedTemporaryFile(delete=False) as nf:
for _ in xrange(1000):
nf.write(''.join(str(random.randint(0, 1000)) for _ in xrange(1000)))
这个解决方案相当于,但比原始问题中的代码更快(我机器上的2.6秒,而不是3.8秒).
总之,上面的第一个简单方法对您来说可能足够快.如果不是,并且整个文件可以适合内存,第二种方法既快速又简单.否则,你最初的想法(更少的写入,更大的块)是好的,因为它与“单写”方法一样快,并且仍然非常简单,如上所述.