复杂度分析
- 最坏情况时间复杂度:代码在最理想情况下执行的时间复杂度
- 最好情况时间复杂度:代码在最坏情况下执行的时间复杂度
- 平均时间复杂度:用代码在所有情况下执行的次数的加权平均值表示
- 均摊时间复杂度:在代码执行的所有复杂度情况中绝大部分是低级别的复杂度,个别情况是高级别复杂度且发生具有时序关系时,可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度
为什么要引入这4个概念
- 同一段代码在不同情况下时间复杂度会出现量级差异,为了更全面,更准确的描述代码的时间复杂度,所以引入这4个概念
- 代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下,是不需要区别分析他们
如何分析
//在数组中查找值等于x的下标
// n 表示数组 array 的长度
int find(int[] array, int n, int x) {
int i = 0;
int pos = -1;
for (; i < n; ++i) {
if (array[i] == x) {
pos = i;
break;
}
}
return pos;
}
最好时间复杂度:O(1) ---->因为有一种情况,就是数组的第一个就是他要找的元素
最坏时间复杂度:O(n) ---->因为有一种情况,如果这个x不在数组中的时候,我们就得吧数组全部遍历一遍
平均时间复杂度:O(n)
分析:
- 先分析情况: 有n+1种循环情况---->在数组中的0~n-1 位置中和不在数组中。
- 计算平均值:
- 普通平均值(X1+X2+X3+X4+…+Xn)/n 有n种情况,求每一种的平均值,与分子的数据类型无关。只与个数数量有关)
要查找的变量x在数组中的位置,有n+1种情况:在数组的0~n-1位置中和不在数组中。
我们把每种情况下,查找需要遍历的元素个数累加起来,然后再除以n+1,就可以得到需要遍历的元素个数的平均值 - 加权平均值
- 普通平均值(X1+X2+X3+X4+…+Xn)/n 有n种情况,求每一种的平均值,与分子的数据类型无关。只与个数数量有关)
概率 | 情况1 | 情况2 |
---|---|---|
— | 在数组中 | 不在数组中 |
概率 | 1/2 | 1/2 |
— | 在数组中每个元素的概率 | 不在数组中每个元素的概率 |
概率 | 1/n | 1 |
要查找的变量x,可以分为两种情况
在数组中
和不在数组中
- 假设这两种情况的概率都是1/2。
- 另外,要查找的数据出现在0~n-1这n个位置的概率也是一样的,为1/n。
所以根据概率乘法法则,要查找的数据出现在0~n-1的位置的概率1/2n。然后把每种情况乘以概率相加,就得到他的加权平均值,用大O表示法来表示,去掉常量和系数,这段代码的加权平均时间复杂度依旧是O(n)
均摊时间复杂度
分析方法---->摊还分析(或者叫平摊分析)
// array 表示一个长度为 n 的数组
// 代码中的 array.length 就等于 n
int[] array = new int[n];
int count = 0;
void insert(int val) {
if (count == array.length) {
int sum = 0;
for (int i = 0; i < array.length; ++i) {
sum = sum + array[i];
}
array[0] = sum;
count = 1;
}
array[count] = val;
++count;
}
这段代码实现了一个往数组中插入数据的功能。当数组满了之后,也就是代码中count==array.length时,我们用for循环遍历数组求和,并清空数组,将求和之后的sum值放到数组的第一个位置,然后再讲新的数据插入。但如果数组一开始就有空闲空间,则直接将数据插入数组。
最好时间复杂度:O(1)---->最理想的情况下,数组有空闲空间,我们只需要将数据插入到数组下标为count的位置就可以了。
最坏时间复杂度:O(n)---->最坏的情况下,数组中没有空闲空间了,我们需要先做一次数组的遍历求和,然后再将数据插入,所以最坏的时间复杂度为O(n)
加权平均时间复杂度:O(1)
分析:假设数组的长度是n,根据数据插入的位置的不同,我们可以分为n种情况,每种情况的时间复杂度为O(1).除此之外,还有一种额外的情况,就是在数组没有空闲空间时插入一个数据,这个时候的时间复杂度是O(n).而且这n+1种情况发生的概率一样,都是1/(n+1).所以根据加权平均的计算方法,我们求得的平均时间复杂度就是
1p+1p+…+np+np,这种加权平均数计算,1是代码执行的次数,p是概率
对比
- find()函数在极端情况下,复杂度才为O(1).但是insert()在大部分情况下,时间复杂度为O(1).只有个别情况下,复杂度才比较高,为O(n)
- 对于insert()函数来说,O(1)时间复杂度的插入和O(n)的时间复杂度的插入,出现的频率是非常有
规律
的,而且有一定的前后时序关系
,一般都是一个O(n)插入之后,紧跟着n-1个O(1)的插入操作,循环往复。
针对这种特殊的场景的复杂度,我们不需要像平均复杂度分析方法那样,找出所有的收入情况及其相应的发生概率
均摊时间复杂度:O(1)
分析:每一次O(n)的插入操作,都会跟着n-1次的O(1)的插入操作,所以把耗时多的那次操作均摊到接下来的n-1次耗时少的操作上,均摊下来,这一组连续的操作的均摊时间复杂度就是O(1)
对一个数据结构进行一组连续操作中,大部门情况下时间复杂度都很低,只有个别情况下时间复杂度比较高,而且这些操作之间存在前后连贯的时序关系,这个时候,我们就可以将这一组数据放在一块儿分析,看看能否将较高时间复杂度那次操作的耗时,平摊到其他那些时间复杂度比较低的操作上,而且在能够应用均摊时间复杂度分析的场合,一般均摊时间复杂度度就等于最好情况时间复杂度