【 Python】冒泡排序-CSDN博客

本文链接：https://blog.csdn.net/yangjia96/article/details/148500309

Python 中的冒泡排序 (Bubble Sort)

第一章：冒泡排序的哲学与内部核心机制

冒泡排序不仅仅是一种排序算法，它更是一种思想的具象化，一种将无序转化为有序的最直观、最朴素的尝试。它的名字“冒泡”本身就是一个生动的比喻，描述了数据元素在序列中如同水中的气泡一样，根据其“重量”（即数值大小），逐步浮向最终位置的过程。理解冒泡排序，是理解所有基于比较的排序算法的基石。

1.1 核心思想：成对比较与交换 (Pairwise Comparison and Swapping)

冒泡排序的灵魂在于两个基本操作的重复执行：

比较 (Compare): 选取序列中两个相邻的元素。
交换 (Swap): 如果这两个元素的顺序不符合目标顺序（例如，在升序排序中，前一个元素大于后一个元素），则交换它们的位置。

算法重复地“遍历”整个待排序序列，在每一轮遍历中，对序列中所有相邻的元素执行上述的“比较-交换”操作。这个过程会一直持续，直到某一轮完整的遍历中，没有发生任何一次交换。此时，整个序列必然已经达到了有序状态。

1.2 一趟排序的微观过程：最大（或最小）元素的“冒泡之旅”

让我们通过一个具体的例子，来显微镜般地观察一趟完整的冒泡排序过程，从而深刻理解“冒泡”的含义。

假设我们有待排序数组 nums = [5, 1, 4, 2, 8]，我们的目标是进行升序排序。

第一趟 (Pass 1):

目标: 将整个数组中的最大元素“推送”到数组的最右端。
起始状态: [5, 1, 4, 2, 8]
步骤 1: 比较索引 0 和 1
- 比较 nums[0] (值为 5) 和 nums[1] (值为 1)。
- 因为 5 > 1，顺序错误，需要交换。
- 数组状态变为: [1, 5, 4, 2, 8]
步骤 2: 比较索引 1 和 2
- 比较 nums[1] (值为 5) 和 nums[2] (值为 4)。
- 因为 5 > 4，顺序错误，需要交换。
- 数组状态变为: [1, 4, 5, 2, 8]
步骤 3: 比较索引 2 和 3
- 比较 nums[2] (值为 5) 和 nums[3] (值为 2)。
- 因为 5 > 2，顺序错误，需要交换。
- 数组状态变为: [1, 4, 2, 5, 8]
步骤 4: 比较索引 3 和 4
- 比较 nums[3] (值为 5) 和 nums[4] (值为 8)。
- 因为 5 < 8，顺序正确，无需交换。
- 数组状态保持: [1, 4, 2, 5, 8]
第一趟结束: 观察最终的数组 [1, 4, 2, 5, 8]。我们可以发现，虽然整个数组尚未完全有序，但最大的元素 8 已经通过一系列的比较和交换（或未交换），被成功地“护送”到了它最终应该在的位置——数组的最末端。这个过程，就像一个最重的物体在水中沉底，或者一个最轻的气泡在水中浮到顶端，这正是“冒泡”这个名字的由来。

在每一趟完整的遍历之后，我们都能保证一个当前未排序部分的最大（或最小）元素被放置到了其最终位置。这个性质是后续所有优化的基础，也是我们能够证明算法正确性的关键。

第二章：从朴素到精炼：冒泡排序的实现与优化

冒泡排序的实现可以从一个最基础、最不加修饰的版本开始，然后通过引入两个关键的优化思想，演变成一个在特定场景下效率更高的“精炼版”。

2.1 基础实现：双重循环的经典结构

这是冒泡排序最原始的形态，它严格地执行 n-1 趟排序，每趟都比较到数组的末尾。

def bubble_sort_naive(nums):
    """
    最基础、最朴素的冒泡排序实现。
    
    参数:
        nums (list): 一个需要排序的数字列表。
        
    返回:
        None: 函数直接在原列表上进行修改（原地排序）。
    """
    n = len(nums) # 获取列表的长度
    
    # 外层循环控制排序的总趟数。对于n个元素，最多需要n-1趟。
    for i in range(n - 1):
        
        # 内层循环负责在每一趟中进行相邻元素的比较和交换。
        # 每一趟都从头开始，比较到数组末尾。
        for j in range(n - 1):
            
            # 比较相邻的两个元素
            if nums[j] > nums[j+1]:
                # 如果前一个元素大于后一个元素，则交换它们的位置
                nums[j], nums[j+1] = nums[j+1], nums[j]

# 示例
# arr = [5, 1, 4, 2, 8]
# bubble_sort_naive(arr)
# print(f"朴素冒泡排序结果: {arr}") # -> [1, 2, 4, 5, 8]

分析: 这个版本的实现虽然能得到正确结果，但存在巨大的冗余。即使数组在第一趟排序后就已经完全有序，它仍然会毫无知觉地继续执行完剩下的所有 n-2 趟循环，做了大量不必要的比较。

2.2 优化一：提前终止 (Early Termination)

这是对冒泡排序最重要、最常见的优化。其核心思想是：如果在某一趟完整的遍历中，没有发生任何一次元素交换，那么我们就可以断定整个序列已经是有序的了，后续的所有遍历都可以安全地省略。

实现逻辑

我们引入一个布尔类型的标志位 swapped。

在每一趟（外层循环）开始之前，将 swapped 设置为 False。
在内层循环中，如果发生了一次交换，就立刻将 swapped 设置为 True。
在一趟（外层循环）结束之后，检查 swapped 的值。如果它仍然是 False，说明这一趟没有任何交换发生，数组已有序。此时，我们直接 break 外层循环，提前终止排序。

代码实现 (带提前终止优化)

def bubble_sort_optimized_flag(nums):
    """
    带有提前终止优化的冒泡排序。
    如果一趟排序中未发生任何交换，则数组已有序，算法提前结束。
    
    参数:
        nums (list): 一个需要排序的数字列表。
    """
    n = len(nums) # 获取列表长度
    
    # 外层循环控制排序的总趟数
    for i in range(n - 1):
        
        swapped = False # 初始化交换标志为False

        # 内层循环进行比较和交换
        for j in range(n - 1):
            
            if nums[j] > nums[j+1]: # 如果前一个元素大于后一个
                nums[j], nums[j+1] = nums[j+1], nums[j] # 交换它们
                swapped = True # 将交换标志设置为True
        
        # 检查在一整趟内层循环后，是否发生过交换
        if not swapped:
            # 如果swapped仍然是False，说明列表已经有序
            break # 提前跳出外层循环

# 示例
# arr = [1, 2, 4, 5, 8] # 一个已经有序的数组
# bubble_sort_optimized_flag(arr) # 将只会执行一趟就结束
# print(f"对有序数组排序结果: {arr}")

影响: 这个优化极大地改善了冒泡排序在“几乎有序”或“完全有序”的输入下的性能。对于一个已经有序的数组，其时间复杂度从 O(n²) 骤降至 O(n)，因为它只需要完整地遍历一遍来确认没有交换即可。

2.3 优化二：缩减比较范围 (Shrinking the Comparison Range)

回顾第一章的分析，我们知道，经过第一趟排序后，最大的元素已经“冒泡”到了数组的最后一个位置；经过第二趟后，第二大的元素已经到了倒数第二个位置…

以此类推，经过 i 趟排序后，数组的最后 i 个元素必然已经是有序的，并且是整个数组中最大的 i 个元素。

因此，在后续的排序趟数中，我们完全没有必要再去比较这些已经“就位”的元素。我们可以动态地缩减内层循环的比较范围。

实现逻辑

内层循环的上限不再是固定的 n-1，而是 n - 1 - i，其中 i 是外层循环的计数器（代表已经完成的趟数）。

第 0 趟 (i=0)，比较范围是 0 到 n-2。
第 1 趟 (i=1)，比较范围是 0 到 n-3。
…
第 i 趟，比较范围是 0 到 n-2-i。

2.4 最终精炼版：融合两种优化的实现

在实践中，我们会将上述两种优化结合起来，得到一个性能最优的冒泡排序版本。

def bubble_sort_refined(nums):
    """
    融合了两种优化的最终版冒泡排序：
    1. 提前终止标志。
    2. 缩减每趟的比较范围。
    
    参数:
        nums (list): 一个需要排序的数字列表。
    """
    n = len(nums) # 列表长度
    
    # 外层循环控制排序的总趟数, i 代表已经有多少个元素被放置在末尾的正确位置
    for i in range(n - 1):
        
        swapped = False # 初始化交换标志

        # 内层循环的范围是 0 到 n-1-i-1 = n-i-2
        # n-i 是当前待排序部分的长度，所以比较到它的倒数第二个元素即可
        for j in range(n - 1 - i):
            
            if nums[j] > nums[j+1]: # 比较相邻元素
                nums[j], nums[j+1] = nums[j+1], nums[j] # 交换
                swapped = True # 标记发生了交换
        
        # 如果在一趟结束后没有发生交换，则提前终止
        if not swapped:
            break

# 示例
# arr_rev = [8, 5, 4, 2, 1] # 一个逆序的数组
# bubble_sort_refined(arr_rev)
# print(f"精炼版冒泡排序结果: {arr_rev}") # -> [1, 2, 4, 5, 8]

这个精炼版本是冒泡排序的“标准形态”，它在保留算法核心思想的同时，剔除了最明显的冗余操作，是我们在讨论冒泡排序性能时的基准。

第三章：算法特性深度剖析

冒泡排序虽然简单，但其背后蕴含的算法特性——复杂度、稳定性、适应性等——是衡量所有排序算法的通用标尺。深入理解这些特性，比记住算法本身更为重要。

3.1 时间复杂度 (Time Complexity) 的三维视角

时间复杂度衡量的是算法执行时间随输入规模 n 增长的趋势。

a. 最坏情况 (Worst Case): O(n²)

触发场景: 当输入数组完全逆序时，例如 [5, 4, 3, 2, 1]。
分析: 在这种情况下，每一趟排序中，每个元素都需要移动。一个元素要想从数组头部移动到尾部，必须在每一趟中都向右移动一个位置。
- 第一趟需要 n-1 次比较和 n-1 次交换。
- 第二趟需要 n-2 次比较和 n-2 次交换。
- …
- 最后一趟需要 1 次比较和 1 次交换。
总比较次数: (n-1) + (n-2) + ... + 1 = n * (n-1) / 2。
总交换次数: 与比较次数相同。
结论: 总操作数与 n² 成正比，因此最坏情况时间复杂度为 O(n²)。即使是优化后的版本，由于每趟都有交换发生，swapped 标志无法使其提前终止，因此复杂度依然是 O(n²)。

b. 最好情况 (Best Case): O(n)

触发场景: 当输入数组已经完全有序时，例如 [1, 2, 3, 4, 5]。
分析: 这个场景凸显了“提前终止”优化的威力。
- 算法会执行第一趟排序。
- 内层循环会从头到尾进行 n-1 次比较。
- 在所有这 n-1 次比较中，nums[j] > nums[j+1] 永远不成立，因此不会发生任何交换。
- swapped 标志从始至终保持为 False。
- 第一趟结束后，外层循环检查到 swapped 为 False，立即 break。
结论: 算法只执行了大约 n-1 次比较，没有执行交换。总操作数与 n 成正比，因此最好情况时间复杂度为 O(n)。

c. 平均情况 (Average Case): O(n²)

触发场景: 随机顺序的数组。
分析: 在平均情况下，数组中大约有一半的元素对是“逆序”的。我们需要多次遍历来消除这些“逆序对”。虽然 swapped 标志可能会让算法比最坏情况稍早结束几趟，但总体上，需要的遍历趟数和每趟的比较次数仍然与 n 的规模相关。
数学视角: 算法的运行时间与数组中“逆序对”的数量密切相关。一个逆序对 (i, j) 是指 i < j 但 nums[i] > nums[j]。冒泡排序的每次交换，恰好能消除一个逆序对。一个随机数组的逆序对数量期望为 n(n-1)/4，这个数量级是 O(n²)。因此，平均情况下的时间复杂度也是 O(n²)。

3.2 空间复杂度 (Space Complexity): O(1) 的典范

分析: 冒泡排序是一种原地排序 (in-place sorting) 算法。在整个排序过程中，我们只需要常数个额外的变量来存储临时值（如 n, i, j, swapped，以及交换时的一个临时变量，虽然Python的元组交换 a,b=b,a 隐藏了这个细节）。
结论: 无论输入数组的规模 n 有多大，算法所需的额外内存空间都是一个固定的常量。因此，其空间复杂度为 O(1)。
意义: 这个特性在内存极其受限的环境下（例如某些微控制器、嵌入式系统）是一个重要的优点。当可用内存甚至不足以存放一个与原数组等大的辅助数组时，像归并排序这样需要 O(n) 额外空间的算法就无法使用，而冒泡排序这样的原地算法则成为可能。

3.3 稳定性 (Stability): 一个被低估的关键特性

定义: 一个排序算法是稳定的，如果它能保证在排序后，值相等的元素的原始相对顺序不发生改变。
示例: 假设我们有一组学生数据 [( "张三", 90), ( "李四", 85), ( "王五", 90)]，我们希望按分数降序排序。
- 一个稳定的排序算法会得到 [( "张三", 90), ( "王五", 90), ( "李四", 85)]。"张三"和"王五"分数相同，由于"张三"在原始列表中先出现，所以排序后他依然在"王五"前面。
- 一个不稳定的排序算法可能会得到 [( "王五", 90), ( "张三", 90), ( "李四", 85)]，它搞乱了同分学生的原始顺序。

冒泡排序的稳定性证明

冒泡排序是稳定的。其稳定性的根源在于它的交换机制。

交换条件: 冒泡排序的交换操作只发生在 nums[j] > nums[j+1] 的情况下。
相等情况: 如果 nums[j] == nums[j+1]，条件不满足，算法绝对不会对这两个相等的元素进行交换。
结论: 既然相等的元素永远不会被交换位置，它们之间的原始相对顺序就自然而然地被保留了下来。因此，冒泡排序是稳定的。

意义: 稳定性在很多现实场景中至关重要。例如，在多级排序中（先按A字段排序，再按B字段排序），第二次排序必须是稳定的，才能不破坏第一次排序的结果。

3.4 适应性 (Adaptivity)

定义: 一个排序算法是自适应的，如果它的性能能够根据输入数据的“有序程度”进行调整。
分析:
- 朴素的冒泡排序不是自适应的。无论输入多么有序，它都固执地执行 O(n²) 的操作。
- 带有提前终止优化的冒泡排序是自适应的。对于一个几乎有序的数组，它可能只需要几趟（甚至一趟）就能完成排序，性能远好于 O(n²)。

第四章：形式化正确性证明：循环不变式

为了达到学术上的深度，我们可以使用“循环不变式 (Loop Invariant)”这一强大的数学工具来严格证明精炼版冒泡排序算法的正确性。

循环不变式是一个在循环的每次迭代前后都保持为真的断言。证明过程包含三步：

初始化 (Initialization): 证明在循环第一次迭代开始前，不变式为真。
保持 (Maintenance): 证明如果在某次迭代开始前不变式为真，那么在这次迭代结束后，它仍然为真。
终止 (Termination): 证明当循环终止时，不变式能为我们提供一个有用的属性，这个属性直接证明了算法的正确性。

外层循环的不变式

对于 for i in range(n - 1): 这个外层循环，我们可以定义如下的循环不变式：

循环不变式: 在第 i 次迭代（i 从0开始计数）开始之前，数组的子序列 nums[n-i:] (即数组的最后 i 个元素) 已经包含了整个数组中最大的 i 个元素，并且这 i 个元素已经处于它们最终的、排好序的位置。

证明过程

初始化: 当 i = 0 时，循环第一次迭代开始前。不变式声称 nums[n-0:] (一个空子序列) 包含了最大的0个元素且已有序。这个陈述是平凡为真的。
保持: 假设在第 i 次迭代开始前，不变式为真。这意味着 nums[n-i:] 已经包含了最大的 i 个元素且有序。
- 现在我们执行第 i 次迭代。内层循环 for j in range(n - 1 - i): 会在 nums[0...n-1-i] 这个子数组中进行冒泡操作。
- 根据冒泡排序的单趟效果，这次内层循环结束后，nums[0...n-1-i] 这个范围内的最大元素会被“冒泡”到索引 n-1-i 的位置。
- 这个被冒泡上来的元素，是除去 nums[n-i:] 中已就位的 i 个最大元素之外的、所有剩余元素中的最大值。换句话说，它就是整个数组中第 i+1 大的元素。
- 因此，在第 i 次迭代结束后，nums[n-(i+1):] (即原来的 nums[n-1-i] 加上 nums[n-i:]) 包含了整个数组中最大的 i+1 个元素，并且它们都有序地排列在数组的末尾。
- 这恰好证明了在下一次（即第 i+1 次）迭代开始前，不变式依然成立。
终止: 外层循环在 i = n-2 执行完后终止（或者因为 swapped 标志提前终止）。让我们考虑正常终止的情况，循环在 i 增加到 n-1 时不满足条件而终止。
- 此时，我们考察 i = n-1 时的情况。根据不变式，在第 n-1 次迭代开始前，nums[n-(n-1):] 即 nums[1:] (从第二个元素到最后一个元素) 已经包含了最大的 n-1 个元素且已有序。
- 既然最大的 n-1 个元素已经各就其位，那么剩下的唯一一个元素 nums[0] 必然是最小的元素，它也自然地处在了正确的位置。
- 因此，当循环终止时，整个数组 nums[0:] 都是有序的。

这个证明严谨地说明了冒泡排序算法必然能得到一个完全排序的数组。

第五章：算法变体：鸡尾酒摇摆排序

冒泡排序有一个广为人知的变体，它试图解决冒泡排序的一个内在缺陷，这个缺陷常被戏称为“乌龟问题 (The Turtle Problem)”。

5.1 “乌龟与兔子”：冒泡排序的内在缺陷

在标准的冒泡排序中，元素只能单向移动。在升序排序中，较大的元素（兔子）可以很快地向右“冒泡”到队尾。
但是，一个非常小的元素如果处在数组的末尾（乌龟），它在每一趟排序中只能向左移动一个位置。这使得它需要很多趟才能“爬”到数组的开头。

5.2 鸡尾酒摇摆排序 (Cocktail Shaker Sort)

这个算法也叫双向冒泡排序 (Bidirectional Bubble Sort)，它的核心思想就是引入双向移动。

算法流程

它将一趟完整的排序过程分成了两个阶段：

从左到右冒泡 (正向): 和标准冒泡排序一样，从左到右遍历，将当前范围内的最大元素“冒泡”到右边。
从右到左冒泡 (反向): 紧接着，从右到左遍历，将当前范围内的最小元素“冒泡”到左边。

这个过程就像调酒师摇晃调酒杯一样，来回进行，直到某一完整的“来回”过程中没有发生任何交换。

代码实现

def cocktail_shaker_sort(nums):
    """
    鸡尾酒摇摆排序（双向冒泡排序）的实现。
    
    参数:
        nums (list): 一个需要排序的数字列表。
    """
    n = len(nums)
    swapped = True # 初始化交换标志，以确保循环至少执行一次
    start = 0      # 待排序部分的起始索引
    end = n - 1    # 待排序部分的结束索引

    while swapped:
        # 在循环开始时重置交换标志
        swapped = False

        # --- 第一阶段: 从左到右冒泡 (正向) ---
        # 将最大元素推向右边
        for i in range(start, end):
            if nums[i] > nums[i+1]:
                nums[i], nums[i+1] = nums[i+1], nums[i]
                swapped = True
        
        # 如果在正向冒泡中没有发生交换，说明数组已经有序
        if not swapped:
            break

        # 正向冒泡结束后，最右边的元素已经就位，更新右边界
        end = end - 1

        # --- 第二阶段: 从右到左冒泡 (反向) ---
        # 在下一次循环开始前，再次重置交换标志，因为正向可能换了但反向可能不换
        swapped = False

        # 将最小元素推向左边
        for i in range(end - 1, start - 1, -1):
            if nums[i] > nums[i+1]:
                nums[i], nums[i+1] = nums[i+1], nums[i]
                swapped = True
        
        # 反向冒泡结束后，最左边的元素已经就位，更新左边界
        start = start + 1

# 示例
# arr_cocktail = [5, 1, 4, 2, 8, 3, 6]
# cocktail_shaker_sort(arr_cocktail)
# print(f"鸡尾酒排序结果: {arr_cocktail}")

性能分析

时间复杂度: 尽管鸡尾酒排序看起来更“智能”，但它并没有改变算法的渐进时间复杂度。在最坏和平均情况下，它仍然是 O(n²)。
实际性能: 在实践中，它通常比标准的冒泡排序性能稍好，但提升的只是一个常数因子，而不是数量级。它能更快地将“乌龟”和“兔子”都移动到正确的位置。
结论: 鸡尾酒排序是对冒泡排序一个有趣的改进和探索，但它并没有从根本上解决 O(n²) 的瓶颈，因此在实用性上与冒泡排序处于同等级别。

第六章：冒泡排序的应用哲学：何时思考，而非使用

在现代软件开发中，一个核心的共识是：几乎在任何需要对大量数据进行通用排序的场景下，都不应该使用冒泡排序。 像 Python 内置的 sort() 或 sorted() (基于 Timsort，一种高效的混合稳定排序算法) 这样的 O(n log n) 算法，在性能上具有压倒性的优势。

然而，对冒泡排序的深度理解并非无用。它的价值不在于直接的“生产应用”，而在于其揭示的算法设计原则和在某些极端利基市场 (Niche Market) 中的思想模型。

6.1 核心价值：算法教育的基石

冒泡排序是计算机科学入门课程中教授的第一个排序算法，其地位无可替代。

直观性: 它完美地展示了“排序”这一抽象概念的物理过程。
基础概念教学: 它是讲解时间/空间复杂度分析、原地排序、稳定性、循环不变式等核心概念的最佳载体。
优化思维的起点: 从朴素版到优化版的过程，生动地教会了学生如何发现并消除算法中的冗余，是培养算法优化思维的第一课。

6.2 利基场景一：计算机图形学中的简单列表

在某些早期的或简化的计算机图形学应用中，可能会遇到需要对少量（例如，少于10个）半透明多边形进行深度排序（从后往前绘制）的场景。

问题: 多边形数量极少。
要求: 算法必须是稳定的，以避免两个深度相近的物体发生闪烁。
考量: 在 n 极小的情况下，n² 和 n log n 的实际差异可以忽略不计。此时，冒泡排序的实现极其简单（代码行数少）、无需额外内存、稳定性有保证等特点，使其成为一个“足够好”的、甚至是合理的选择。开发者可能会因为其实现的便捷性而选择它，而不是引入一个更复杂的排序函数。