当使用内置函数的时候,有可能不太确定时间复杂度大概是多少。参考链接的内容,以None操作,list的sort()和count()为例,本文给出了一种大致验证时间复杂度的代码。但该方法精度有限,只能用来大概看一看。
方法
通过timeit库,给出不同n下的耗时Tn (1<=n<=N),并以N为横坐标,T为纵坐标绘制成图像,根据图像大概判断函数的时间复杂度。
代码
import timeit
from math import log10
from math import log2
import matplotlib.pyplot as plt
## None操作
data = []
for i in [2**x for x in range(16)]:
data.append((i, timeit.timeit('pass', setup='import random; x=list(range(%d)); random.shuffle(x);' % i, number=1000)))
log_data = []
for i in range(len(data)):
log_data.append((log2(data[i][0]), log2(data[i][1])))
plt.figure()
plt.scatter(*zip(*log_data))
plt.xlabel('log(n)')
plt.ylabel('log(time)')
plt.savefig('None_complexity')
## count操作
data = []
for i in [2**x for x in range(16)]:
data.append((i, timeit.timeit('x.count(0)', setup='import random; x=list(range(%d)); random.shuffle(x);' % i, number=1000)))
log_data = []
for i in range(len(data)):
log_data.append((log2(data[i][0]), log2(data[i][1])))
plt.figure()
plt.scatter(*zip(*log_data))
plt.xlabel('log(n)')
plt.ylabel('log(time)')
plt.savefig('count_complexity')
## sort操作
data = []
for i in [2**x for x in range(16)]:
data.append((i, timeit.timeit('x.sort()', setup='import random; x=list(range(%d)); random.shuffle(x);' % i, number=1000)))
log_data = []
for i in range(len(data)):
log_data.append((log2(data[i][0]), log2(data[i][1])))
plt.figure()
plt.scatter(*zip(*log_data))
plt.xlabel('log(n)')
plt.ylabel('log(time)')
plt.savefig('sort_complexity')
分析
代码中的data是[n,Tn]的组合,其中Tn通过timeit求得,其中的setup表示只执行一次的代码。
为了方便观察,以及与logN配合,因此代码中对data取了对数得到了log_data。 之所以以2为底是在对数底数与点数之间所作的权衡。因为底数越接近10,点数往往会越小。number是重复执行的次数,越大越耗时但误差也越小。
pass,x.sort(),x.count()则分别是3个操作,在每一次执行时都会执行,从而绘制出耗时曲线,大概观察时间复杂度。
结果
None操作的结果:
理论上应该是O(1),结果为
count操作的结果:
理论上是O(N),结果为
sort操作的结果:
理论上是O(NlogN),结果为
总结
可以看到,该方法只能作大致观察,而且受限于运行时间和误差,对时间复杂度相差不大的操作,如N和NlogN并不能得到很好的结果。但用来单纯验证时间复杂度还是得到大概的结果。