【定量分析】插入排序运行时间与输入数组元素排列之间的关系

最新推荐文章于 2024-07-13 10:04:47 发布

leehyukshuai

最新推荐文章于 2024-07-13 10:04:47 发布

阅读量227

点赞数

分类专栏： C 算法文章标签：算法 c++

本文链接：https://blog.csdn.net/leehyukshuai/article/details/128554167

版权

C 同时被 2 个专栏收录

17 篇文章 1 订阅

订阅专栏

算法

5 篇文章 0 订阅

订阅专栏

结论：插入排序的时间复杂度的更精确的量度应该为： $\Theta(n+m)$ ，其中n为数组规模，m为数组逆序对数。

众所周知，插入排序的最佳时间复杂度为 $\Theta(n)$ ，平均时间复杂度和最差时间复杂度为 $\Theta(n^2)$ ，那么给出任意一个输入序列，如何计算使用插排的运行时间？

首先考虑，随着数组的无序程度增加，运行时间自然会增加，而这个无序程度的最直白的量度就应当是逆序对数。

给出插入排序的伪代码：

1 for i = 2 to n:	// 从1开始计数
2 	key = A[i]
3 	// Insert A[i] into the sorted subarray A[1:i–1].
4 	j = i – 1
5 	while j > 0 and A[j] > key
6 	   A[j + 1] = A[j]
7 	   j = j – 1
8 	A[j + 1] = key

通过分析每一行代码的执行次数，我们就可以粗略得出排序的运行时间。

首先，1,2,4,8行，各执行n次，则总执行次数为n次。（不考虑常数项、常数因子和注释行）。
其次，设在第i次迭代中，内循环的5,6,7行各执行 $t_i$ 次，那么总执行次数为 $\sum_{i=2}^n t_i$ 次。设A的逆序对数为m。

现在仅剩 $t_i$ 没有清楚的数量定义，考虑插入排序的性质：当插入A[i]时，A[1...i-1]均已按照升序拍好，而现在要将A[i]插入到一个位置，使得该位置前面的元素均不大于A[i]，后面的元素均大于A[i]。容易分析得到， $t_i$ =A[1...i-1]中比A[i]大的元素数量，也就是以A[i]为后件的逆序对数。因此 $\sum_{i=2}^n t_i=m$ 。