算法设计与分析——排序算法（一）：插入排序

最新推荐文章于 2024-05-17 03:08:20 发布

von Neumann

最新推荐文章于 2024-05-17 03:08:20 发布

阅读量1.6w

点赞数 7

分类专栏：算法设计与分析文章标签：算法排序算法插入排序算法导论排序

本文链接：https://blog.csdn.net/hy592070616/article/details/91395729

版权

算法设计与分析专栏收录该内容

49 篇文章 53 订阅

订阅专栏

插入排序对于少量元素的排序是一个有效的算法。插入排序的工作方式像许多人排序一手扑克牌。开始时，我们的左手为空并且桌子上的牌面向下。然后，我们每次从桌子上拿走一张牌并将它插入手中正确的位置。为了找到一张牌的正确位置，我们从右到左将它与已在手中的每张牌进行比较，而拿在手上的牌总是排序好的。

对于插入排序，我们将其代码过程命名为insertionSort(arr)，其中的参数是一个数组 $\cdots, n]$ ，包含长度为 $n$ 的要排序的一个序列。该算法原址排序输入的数：算法在数组 $a r r$ 中重排这些数，在任何时候，最多只有其中的常数个数字存储在数组外面。在过程insertionSort(arr)结束时，输入数组arr包含排序好的输出序列。

def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
    return arr

下图表明对 $A = (5, 2, 4, 6, 1, 3)$ 该算法如何工作。下标 $j$ 指出正被插入到手中的“当前牌”。在for循环（循环变量为 $j$ ）的每次迭代的开始，包含元素 $\cdots, j - 1]$ 的子数组构成了当前排序好的手中的牌，剩余的子数组 $\cdots,n]$ 对应于仍在桌子上的牌堆。事实上，元素 $\cdots, j - 1]$ 就是原来在位置 $1$ 到 $j - 1$ 的元素，但现在已按序排列.我们把 $\cdots, j - 1]$ 的这些性质形式地表示为一个循环不变式：在第2~8行的for循环的每次迭代开始时，子数组 $\cdots, j - 1]$ 由原来在 $\cdots, j - 1]$ 中的元素组成，但已按序排列。
插入排序示意图
循环不变式主要用来帮助我们理解算法的正确性。关于循环不变式，我们必须证明三条性质：

初始化：循环的第一次选代之前，它为真。
保持：如果循环的某次迭代之前它为真，那么下次迭代之前它仍为真。
终止：在循环终止时，不变式为我们提供一个有用的性质，该性质有助于证明算法是正确的。

当前两条性质成立时，在循环的每次迭代之前循环不变式为真。当然，为了证明循环不变式在每次迭代之前保持为真，我们完全可以使用不同于循环不变式本身的其他已证实的事实。注意，这类似于数学归纳法，其中为了证明某条性质成立，需要证明一个基本情况和一个归纳步。这里，证明第一次迭代之前不变式成立对应于基本情况，证明从一次迭代到下一次迭代不变式成立对应于归纳步。第三条性质也许是最重要的，因为我们将使用循环不变式来证明正确性。通常，我们和导致循环终止的条件一起使用循环不变式。终止性不同于我们通常使用数学归纳法的做法，在归纳法中，归纳步是无限地使用的，这里当循环终止时，停止“归纳”。

让我们看看对于插入排序，如何证明这些性质成立。

初始化：首先证明在第一次循环迭代之前（当 $j = 2$ 时），循环不变式成立。所以子数组 $\cdots, j - 1]$ 仅由单个元素 $A [1]$ 组成，实际上就是 $A [1]$ 中原来的元素。而且该子数组是排序好的。这表明第一次循环迭代之前循环不变式成立。
保持：其次处理第二条性质：证明每次选代保持循环不变式。非形式化地，for循环体的第4~7行将 $A [j - 1]$ 、 $A [j - 2]$ 、 $A [j - 3]$ 等向右移动一个位置，直到找到 $A [j]$ 的适当位置，第8行将 $A [j]$ 的值插入该位置。这时子数组 $\cdots, j]$ 由原来在 $\cdots, j]$ 中的元素组成，但已按序排列。那么对for循环的下一次迭代增加 $j$ 将保持循环不变式。第二条性质的一种更形式化的处理要求我们对第5~7行的while循环给出并证明一个循环不变式。然而，这里我们不愿陷入形式主义的困境，而是依赖以上非形式化的分析来证明第二条性质对外层循环成立。
终止：最后研究在循环终止时发生了什么。导致for循环终止的条件是 $j > A . l e n g t h = n$ 。因为每次循环迭代 $j$ 增加 $1$ ，那么必有 $j = n + 1$ 。在循环不变式的表述中将 $j$ 用 $n + 1$ 代替，我们有：子数组 $\cdots, n]$ 由原来在 $\cdots, n]$ 中的元素组成，但已按序排列。注意到，子数组 $\cdots, n]$ 就是整个数组，我们推断出整个数组已排序。因此算法正确。