一、算法效率的度量方法
我们提到设计算法就要尽量的提高效率,这里效率高一般指的是算法的执行时间。所谓“是骡子是马拉出来溜溜”,比较容易想到的方法就是我们把算法跑个若干遍,然后拿个“计算器”在旁边计时。这种事后统计的方法看起来的确不错,并且也并非真的要你拿个计算器在那里算,因为计算机都有计时功能。
- 事后统计方法
——缺陷:必须依据算法事先编好测试程序,通常需要花费大量的时间和精力。不同的测试环境差别很大。 - 事前分析估算方法
举例:
第一种算法
int i, sum=0, n=100; // 执行1次
for(i=1; i<=n; i++) // 执行n+1次
{
sum = sum +i; // 执行n次
}
第二种算法
int i, sum=0, n=100; // 执行1次
sum = (1+n)*n/2; // 执行1次
第一种算法执行了1+(n+1)+n = 2n+2 次
第二种算法执行了1+1 = 2 次
如果我们把循环看做一个整体,忽略头尾判断的开销,那么这两个算法其实就是n和1的差距。
另一方面,我们研究算法的复杂度,侧重的是研究算法随着输入规模扩大增长量的一个抽象,而不是精确地定位需要执行多少次。
结论:随着输入的增加,不同的算法规模不一样。
举例:
看出啥?一条直线,当他们数据很小的时候是这样的:
这组数据我们可以清楚地看出,当n的值变得非常大的时候,3n+1已经没法和2n^2的结果相比较,最终可以忽略不计。而算法G在跟算法I基本上已经重合了。
结论:判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而更应该关注主项(最高项)的阶数。
二、算法时间复杂度
一般情况下,随着输入规模n的增大,T(n)增长最慢的算法为最优算法。
显然,由此算法时间复杂度的定义可知,我们的三个求和算法的时间复杂度分别为O(1),O(n),O(n^2)。
举例:
1.常数阶(蓝线)
int sum=0, n=100;
printf("1115231676@qq.com\n");
printf("1115231676@qq.com\n");
printf("1115231676@qq.com\n");
printf("1115231676@qq.com\n");
printf("1115231676@qq.com\n");
printf("1115231676@qq.com\n");
sum= (1+n)*n/2;
O(8)?
这是初学者常常犯的错误,总认为有多少条语句就有多少。分析一下,按照我们的概念“T(n)是关于问题规模n的函数”来说,打印的邮箱地址,跟问题规模并没有关系!所以我们记作O(1)就可以了。
另外,根据攻略来,那就更简单了,攻略第一条就说明了所有加法常数就给他个O(1)即可。
2.线性阶(红线)
int i, n=100, sum=0;
for(i=0; i<n; i++)
{
sum=sum+i;
}
O(n)
3.平方阶(绿线)
n=100,就是说外层循环每执行一次,内层循环就执行100次,那总的程序想要从这两个循环出来,需要执行100*100次,也就是n的平方。所以这段代码的时间复杂度为O(n^2)。
4.对数阶
int i=1, n=100;
while(i<n)
{
i=i*2;
}
由于每次i*2之后,就距离n更进一步,假设有x个2相乘后大于或者等于n,则会提出循环。
于是由2^x=n得到x=log(2)n,所有这个循环的时间复杂度为O(logn)。
三、函数调用的时间复杂度分析
举例:
n++
function(n);
for(i=0; i<n; i++)
{
function(i);
}
for(i=0; i<n; i++)
{
for(j=i; j<n; j++)
{
printf("%d",j);
}
}
O(n^2)
常见的时间复杂度:
最坏情况与平均情况:
比如我们查找一个有n个随机数字数组中的某个数字,最好的情况是第一个数字就是,那么算法的时间复杂度为O(1),但也有可能这个数字就在最后一个位置,那么时间复杂度为O(n)。
平均运行时间就是期望的运行时间。
最坏运行时间是一种保证。
四、算法的空间复杂度
s(n)=O( f(n) )