在刚开始学习数据结构时,我们最先接触的就是复杂度,在一些oj题中也会有对时间复杂度和空间复杂度的要求,所以对复杂度的了解和计算是非常有必要的。
如何衡量一个算法的好坏
首先,这个算法必须是正确的
其次,好的算法应该是友好的,便于人们理解和交流,并且是机器可执行的。
这个算法还需要足够健壮,即当输入的数据非法或不合理时,也能适当的做出正确的反应或进行相应的处理
最后它还必须拥有高效率和低存储量要求。
也就是所谓的时间复杂度和空间复杂度
复杂度的概念
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般 是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。
在计算 机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计 算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度和空间复杂度是衡量算法好坏非常重要的因素,对于同一个问题,我们可能会有很多种解法,但是我们该如何去选择呢?这两个就是很重要的参考因素,接下来也就聊聊时间复杂度和空间复杂度的具体概念和实际算法
时间复杂度的定义
算法的执行时间
算法的执行时间等于它所有基本操作执行时间之和, 而一条基本操作的执行时间等于它执行的次数和每一次执行的时间的积,
如下:
算法的执行时间 = 操作1 + 操作2 + … + 操作n
操作的执行时间 = 操作执行次数 X 执行一次的时间
然而存在一个问题,不同的编程语言,不同的编译器,或不同的CPU等因素将导致执行一次操作的时间各不相同,这样的结果会使算法的比较产生歧义, 于是我们假定所有计算机执行相同的一次基本操作所需时间相同,而把算法中基本操作所执行的最大次数作为量度。就是说我们把算法的执行时间简单地用基本操作的执行次数来代替了。
那么除此之外,基本操作是什么? 它可以是基本运算,赋值,比较,交换等,如在排序中,基本操作指的是元素的比较及交换。而在线性查找中,它是数据的比较。
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一 个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个 分析方式。
一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
空间复杂度的定义
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。 空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。 空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。 注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因 此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
只看这些定义,我们是很难理解具体的意思的,所以接下来带大家根据具体的实例来理解。但是我们还需要掌握的一个非常重要的概念
大O的渐进表示法
渐进分析法最常用的表示方法是用于描述函数渐近行为的数学符号,更确切地说,它是用另一个(通常更简单的)函数来描述一个函数数量级的渐近上界。大O符号是由德国数论学家保罗·巴赫曼(Paul Bachmann)在其1892年的著作《解析数论》(Analytische Zahlentheorie)首先引入的。
渐进思想是在了解复杂度概念里所必须要理解的,因为我们不能计算出具体的时间和空间,需要一个近似,而这个近似就是渐进,找到能靠进结果的一个函数来表示最终结果。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到 最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
具体实例来用大O的表示法来表示复杂度
// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N ; ++ i)
{
for (int j = 0; j < N ; ++ j)
{
++count;
}
}
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
}
简单计算可得 次数一共为N * N + 2 * N + M 次,可知时间复杂度为O(N * N + 2 * N + M),但是根据大O表示法的法则,只保留最高阶项,且系数为1,故该算法的时间复杂度为O(N)。对于空间复杂度,开辟了变量count, i, j,M,为常数个,故空间复杂度为O(1)。
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
对于该函数,次数为 M+N次,故时间复杂度为O(M+N),这样写其实也没有问题,但是严格的话,应按照M,N的大小来看。M大,就是O(M),反之为O(N)。也只有常数个变量,故空间复杂度为O(1)。
接下来看看递归的时间复杂度,递归代码非常简短,但是就一定时间很简短,占用空间很少吗?
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if (1 == N)
return 1;
return Fac(N-1)*N;
}
这个算法Fac函数一共运行了多少次呢?
其实是N 次,故算法时间复杂度为O(N)。
空间复杂度呢?每次调用Fac都会开辟新空间,一共开辟了N个,再依次回代到函数中,故空间复杂度也为O(N)。
常见复杂度的对比
由图可以看出,O(logN)是非常快的,很接近于O(N), 例如二分查找的时间复杂度就是O(logN)。
我们需要去寻找效率更高的算法来实现,因为现在的数据量是非常大的,我们需要更短的时间来实现需求。