排序算法（1）插入排序的算法分析

最新推荐文章于 2024-06-05 18:16:56 发布

YuYunTan

最新推荐文章于 2024-06-05 18:16:56 发布

阅读量3.7k

点赞数 8

分类专栏：算法文章标签：排序算法插入排序算法复杂度分析

本文链接：https://blog.csdn.net/YuYunTan/article/details/52026857

版权

算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

导语

导语

   今天，我们介绍的是排序算法经典的一种排序算法，这个算法是插入排序。

相信大家都玩过纸牌。插入排序的工作方式就像许多人排序一手扑克牌。

开始时，我们的左手为空并且桌子上的牌面朝下（意味着我们不在翻开之前并不知道下一张牌是多大的）。

然后，我们每次从那些牌中选出一张牌，并把它插入到正确的位置（一般我们认为左边的最小），我们从左到右（或从右到左）将它与已在手中的每张牌进行比较。
这里写图片描述

动态图演示如下:

这里写图片描述

算法分析

对于插入排序，我们将伪代码的过程命名为INSERTION-SORT
其中

参数是A[1..N]，为长度n的一个需要排序的序列。
A.length表示数组A中元素的数量

该算法在数组A中重排这些数，在任何时候，最多只有其中的常数个数字存储在数组外面。

等INSERTION-SORT结束时，输入数组A包含排序好的输出序列。

算法伪代码

INSERTION-SORT（A）
1   for j=2 to A.length
2       key = A[j]
3       //Insert A[j] into the sorted sequence A[1..j-1]
4       i = j - 1
5       while i > 0 and A[i] > key
6           A[i+1] = A[i]
7           i = i - 1
8       A[i+1]=key

图示分析

这里写图片描述

算法复杂度分析

INSERTION-SORT(A)	代价	次数
for j=2 to A.length	$c_1$	$n$
$\hspace{2em}$ key = A[j]	$c_2$	$n-1$
$\hspace{2em}$ i = j - 1	$c_3$	$n-1$
$\hspace{2em}$ while i > 0 and A[i] > key	$c_4$	$\sum_{j=2}^n t_j$
$\hspace{4em}$ A[i+1] = A[i]	$c_5$	$\sum_{j=2}^n (t_j-1)$
$\hspace{4em}$ i = i - 1	$c_6$	$\sum_{j=2}^n (t_j-1)$
$\hspace{2em}$ A[i+1]=key	$c_7$	$n-1$

该算法的运行时间是执行每条语句的运行时间之和。基于此，我们可以计算在具有n个值输入上INSERTION-SORT(A)的运行时间T[n]，我们将代价与次数列对应元素之积求和，得

T (n) = c 1 n + c 2 (n - 1) + c 3 (n - 1) + c 4 \sum j = 2 n t j + c 5 \sum j = 2 n (t j - 1) + c 6 \sum j = 2 n (t j - 1) + c 7 (n - 1)

$T(n)=c_1n + c_2(n-1)+c_3(n-1) + c_4\sum_{j=2}^nt_j +c_5\sum_{j=2}^n(t_j-1)+c_6\sum_{j=2}^n(t_j-1)+c_7(n-1)$

最好情况下:

对于给定的n个需要排序的，若输入已排序，则出现最佳情况。这个时候，对于j=2,3，….,n，可以发现，当i取初值j-1时，有 $A[i] \leq key$ 。从而对j=2,3,…，n有 $t_j=1$ ,也就是说只需要比较一次。

我估计说到这里，有些人看不懂，我就简单的说吧：

假设现在你左手中的牌都是已经排好序了的，而且是从小到大排序，现在你手上拿了一张牌，比你左手上的牌最右边（即是你手中牌中最大）还要大，那么你一定要保证牌是从小到大的排序，必然会把牌之间放在你牌的最右边。而这个过程，你只是和你本来有的牌的最大一张比较了一次。

所以最好的情况下的时间复杂度 $T_n$ 为:

$T (n) = c 1 n + c 2 (n - 1) + c 3 (n - 1) + c 4 (n - 1) + c 7 (n - 1) = (c 1 + c 2 + c 3 + c 4 + c 7) n - (c 1 + c 2 + c 3 + c 4)$ $T(n)=c_1n+c_2(n-1)+c_3(n-1)+c_4(n-1)+c_7(n-1)\\=(c_1+c_2+c_3+c_4+c_7)n-(c_1+c_2+c_3+c_4)$
即 $T (n) = a n + b$ $T(n)=an+b$

其中 $a$ 和 $b$ 依赖于语句代价 $c_i$ 。

我们可以得出一个结论:

在最好情况下，插入排序的时间复杂度在 $\color{Red}{O(n)}$ ，即 $\color{Blue}{\normalsize 线性时间}$ 上完成排序。

最坏情况下:

若输入数组已方向排序，即按照递减排序排好了序,则导致最坏情况。我们必须把每个元素A[j]与整个已排序子数组A[1..j-1]中的每个元素都要进行比较，所以对j=2,3,…,n，有 $t_j=j$ 。

我估计有人问为什么 $t_j=j$ ，那么我就这样告诉你吧:

$t_j$ 是while语句进行比较语句的执行的次数，最后一次是进行i>0的判断，所以A[1..j-1]与A[j]实际上进行了j-1次比较，那么为什么进行j-1次比较呢，我们这么想，j代表我要加入第几张牌，我就以j=3来说，我即将加入第3张牌进入我左手的牌中（左手有两张牌，已经升序排列了好了），而这个牌比前面2个都要小，那么我是需要和比较两次才知道的，所以一共比较j-1次。

值得注意的是，这时候的
$\sum j = 2 n j = n ( n + 1 ) 2 - 1$ $\sum_{j=2}^nj=\frac{n(n+1)}{2}-1$
以及
$\sum j = 2 n (j - 1) = n ( n - 1 ) 2$ $\sum_{j=2}^n(j-1)=\frac{n(n-1)}{2}$
上述是求和递推公式，我并不会给予证明，毕竟这可不是数学教学。

所以最坏的情况下的时间复杂度 $T_n$ 为:

$T (n) = c 1 n + c 2 (n - 1) + c 3 (n - 1) + c 4 (n ( n + 1 ) 2 - 1) + c 5 (n ( n - 1 ) 2) + c 6 (n ( n - 1 ) 2) + c 7 (n - 1) = (c 4 2 + c 5 2 + c 6 2) n 2 + (c 1 + c 2 + c 3 + c 4 2 - c 5 2 - c 6 2 + c 7) n - (c 2 + c 3 + c 4 + c 7)$ $T(n)=c_1n + c_2(n-1)+c_3(n-1) + c_4(\frac{n(n+1)}{2}-1) +c_5(\frac{n(n-1)}{2})+c_6(\frac{n(n-1)}{2})+c_7(n-1)\\=(\frac{c_4}{2}+\frac{c_5}{2}+\frac{c_6}{2})n^2+(c_1+c_2+c_3+\frac{c_4}{2}-\frac{c_5}{2}-\frac{c_6}{2}+c_7)n-(c_2+c_3+c_4+c_7)$
即
$T (n) = a n 2 + b n + c$ $T(n)=an^2+bn+c$

其中 $a$ 、 $b$ 和 $c$ 依赖于语句代价 $c_i$ 。

我们可以得出一个结论:

在最坏情况下，插入排序的时间复杂度在 $\color{Red}{O(n^2)}$ ，即 $\color{Blue}{\normalsize n的二次函数}$ 上完成排序。

平均情况和最坏情况差不多，复杂度也在 $O(n^2)$

结语

接下来，我将会在下一文中编写出语言版本去实现算法。敬请期待。

YuYunTan

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
排序算法（1）插入排序的算法分析

导语动态图演示如下算法分析算法伪代码图示分析算法复杂度分析导语今天，我们介绍的是排序算法经典的一种排序算法，这个算法是插入排序。相信大家都玩过纸牌。插入排序的工作方式就像许多人排序一手扑克牌。开始时，我们的左手为空并且桌子上的牌面朝下（意味着我们不在翻开之前并不知道下一张牌是多大的）。然后，我们每次从那些牌中选出一张牌，并把它插入到正确的位
复制链接

扫一扫