复杂度分析(下):浅析最好、最坏、平均、均摊时间复杂度
最好、最坏情况时间复杂度
直接上例子
// n 表示数组 array 的长度
int find( int[] array, int n, int x){
int i = 0;
int pos = -1;
for (; i < n, ++i){
if( array[i] == x) pos = i;
}
return pos;
}
这段代码要实现的功能是:在一个无序的数组中,查找变量x出现的位置。如果美哦与找到就返回-1。其复杂度是O(n),n代表数组的长度。
但是在数组中查找一个数据并不需要每次都把整个数组都遍历一遍。这段代码可优化为下面这段
// n 表示数组 array 的长度
int find( int[] array, int n, int x){
int i = 0;
int pos = -1;
for (:, i < n; ++i){
if (array[i] == x){
pos = i;
break;
}
}
return pos;
}
那么优化完的这段代码的时间复杂度还是O(n)么?
变量x可能出现在数组中的任何位置。如果数组中第一个元素正好是要查找的变量x,那就不需要遍历剩下的n-1个数据了,这时时间复杂度为O(1)。但如果数组中不存在变量x,那么就需要把整个数组都办理一遍,时间复杂度就是O(n)。所以不同情况下,这段代码的时间复杂度是一样的。
为了表示代码在不同情况下的不同时间复杂度,我们需要引入三个概念:最好情况时间复杂度、最坏情况时间复杂度、平均情况时间复杂度。
最好情况时间复杂度:在最理想的情况下,执行这段代码的时间复杂度。
最坏情况时间复杂度:在最糟糕的情况下,执行这段代码的时间复杂度。
平均情况时间复杂度
将每种情况发生的概率考虑进去,计算平均时间复杂度。这个值就是概率论中的加权平均值,也叫期望值,所以平均时间复杂度的全称应该叫做加权平均时间复杂度或期望时间复杂度。
上例中,我们知道,要查找的变量x要么在数组里,要么不在数组里。这两种情况对应的概率统计起来很麻烦,为了方便理解,这里都设为1/2。另外,要查找的数据出现在0~1/n这n个位置的概率也一样,为1/n。所以,根据概率乘法法则,要查找的数据出现在0~n-1中任一位置的概率为(1/2n)。因此平均时间复杂度计算过程就是: 1*(1/2n) + 2*(1/2n) +3*(1/2n) +...+n*(1/2n) +n*1/2 = (3n+1)/4。
用大O表示法,这段代码的加权平均时间复杂度任然是O(n)。
均摊时间复杂度
直接上例子:
// array 表示一个长度为n的数组
// 代码中的array.length 等于n
int[] array = new int[n]
int count =0;
void insert(int val){
if (count == array.length){
int sum = 0;
for (int i = 0; i < array.length; ++i){
sum = sum + array[i];
}
array[count] = val;
count = 1;
}
array[count] = val;
++count;
}
这段代码实现了一个往数组中插入数据的功能。当数组满了以后,我们用for循环遍历数组求和,并清空数组,将求和之后的sum值放到数组的第一个位置,然后再讲新的数据插入。但如果数组一开始就有空闲空间,则直接将数组插入数据。
这段代码的最好情况时间复杂度为O(1),即数组中有空闲空间,只需要将数据插入到数组下标为count的位置。最坏时间复杂度为O(n),即空间中没有空闲空间,我们需要先做一次数组的遍历求和,然后再将数据插入。平均时间复杂度为O(1):假设数组的长度为n,根据数据插入的位置的不同,我们可以分为n种情况,每种情况的复杂度为O(1),除此之外,还有可能没有空闲空间,这时的时间负责度为O(n)。而且,这n+1种情况发生的概率都一样,都是1/(n+1),得到2n/(n+1),用大O表示法即O(1)。
这个例子中的平均复杂度的计算不需要引入概率论的知识。因为find()函数在极端复杂情况下,复杂度才为O(1),而insert()函数在大部分情况下,时间复杂度都为O(1)。
针对这种特殊场景的复杂度分析,不需要像之前平均时间复杂度分析那样,找出所有的输入情况及相应的发生概率,在计算加权平均值。针对这种特殊的场景,我们引入了一种更简单的分析方法:摊还分析法,通过摊还分析法得到的时间复杂度教:均摊时间复杂度。
究竟如何使用瘫痪分析法来分析算法的均摊时间复杂度?
继续看数组中插入数据的这个例子。每一个O(n)的插入操作,都会跟着n-1次O(1)的插入操作,所以把耗时多的那次操作均摊到接下来的n-1次耗时少的操作上,均摊下来,这一组连续的操作的均摊时间复杂度就是O(1)。对于一个数据结构进行一组连续操作中,大部分情况下时间复杂度都很低,只有个别情况下时间复杂度比较高,而且这些操作之间存在前后连贯的时序关系,这个时候,我们就可以将这一组操作放在一块儿分析,看是否能将较高时间复杂度那次操作的耗时平摊到其他时间复杂度比较低的操作上。而且,在能够应用均摊时间复杂度分析的场合,一般均摊时间复杂度就等于最好情况时间复杂度。
课后思考
// 全局变量,大小为10的数组array
int array[] = new int[10];
int len = 10;
int i = 0;
// 往数组中添加一个元素
void add(int element){
if (i >= len){//数组空间不够了
// 重新申请一个2倍大小的数组空间
int new_array[] = new int[len*2];
// 把原来 array 数组中的数据依次copy到 new_array
for (int j = 0; j < len; ++j){
new_array[j] = array[j];
}
// new_array 复制给array,array现在大小是2倍len
array = new_array;
len = 2*len;
}
//将element放到下标为i的位置,下标i加一
array[i] = element;
++i;
}
我的解答
最好情况时间复杂度:O(1) 数组中的数据没有满
最坏情况时间复杂度:O(n) 数组中的数据满了,进行n次数据复制,然后再填入变量
均摊时间复杂度:O(1) n种情况数组中的数据没有满,时间复杂度为O(1),1中情况数组中的数据满了,进行n次数据复制,所以时间复杂度为O(n),最后得到时间复杂度为O(1)。