我试图检查numpy.savetxt是否可以加快速度,所以编写了以下模拟:
import sys
import numpy as np
fmt = '%7.0f %11.5e %11.5e %7.5f'
records = 10000
np.random.seed(1234)
aray = np.random.rand(records, 4)
def writ(f, aray=aray, fmt=fmt):
fw = f.write
for row in aray:
fw(fmt % tuple(row))
def prin(f, aray=aray, fmt=fmt):
for row in aray:
print>>f, fmt % tuple(row)
def stxt(f, aray=aray, fmt=fmt):
np.savetxt(f, aray, fmt)
nul = open('/dev/null', 'w')
def tonul(func, nul=nul):
func(nul)
def main():
print 'looping:'
loop(sys.stdout, aray)
print 'savetxt:'
savetxt(sys.stdout, aray)
我发现结果(在我的2.4 GHz Core Duo Macbook Pro,Mac OS X 10.5.8,DMG在python.org上使用的Python 2.5.4,从源代码构建的numpy 1.4 rc1上)令人惊讶,但它们可重复性很高所以我认为他们可能会引起关注:
$py25 -mtimeit -s'import ft' 'ft.tonul(ft.writ)'
10 loops, best of 3: 101 msec per loop
$py25 -mtimeit -s'import ft' 'ft.tonul(ft.prin)'
10 loops, best of 3: 98.3 msec per loop
$py25 -mtimeit -s'import ft' 'ft.tonul(ft.stxt)'
10 loops, best of 3: 104 msec per loop
因此,savetxt似乎比调用write的循环要慢几个百分点…但是好的旧打印(也在一个循环中)似乎比write快几个百分点(我想这避免了某种调用开销).我意识到,相差2.5%左右并不是很重要,但是这并不符合我的直觉,因此我想报告一下. (顺便说一句,使用真实文件而不是/ dev / null只会平均增加6或7毫秒,因此它不会以一种或另一种方式改变太多).