算法设计与分析——排序算法（八）：计数排序

最新推荐文章于 2022-06-27 19:10:07 发布

von Neumann

最新推荐文章于 2022-06-27 19:10:07 发布

阅读量1.9w

点赞数 9

分类专栏：算法设计与分析文章标签：算法算法导论数据结构计数排序排序算法

本文链接：https://blog.csdn.net/hy592070616/article/details/120116817

版权

算法设计与分析专栏收录该内容

49 篇文章 53 订阅

订阅专栏

计数排序假设 $n$ 个输入元素中的每一个都是在 $0$ 到 $k$ 区间内的一个整数，其中 $k$ 为某个整数。当 $k = O (n)$ 时，排序的运行时间为 $\Theta(n)$ 。

计数排序的基本思想是：对每一个输入元素 $x$ ，确定小于 $x$ 的元素个数。利用这一信息，就可以直接把 $x$ 放到它在输出数组中的位置上了。例如，如果有17个元素小于 $x$ ，则 $x$ 就应该在第18个输出位置上。当有几个元素相同时，这一方案要略做修改。因为不能把它们放在同一个输出位置上。

在计数排序算法的代码中，假设输入是一个数组 $A[1\cdots n]$ ，我们还需要两个数组： $B[1\cdots n]$ 存放排序的输出， $C[1\cdots k]$ 提供临时存储空间。

def count_sort(arr):
    B = [0] * len(arr)
    C = [0] * (max(arr) + 1)
    
    for i in arr:
        C[i] += 1
    for i in range(1, max(arr) + 1):
        C[i] += C[i - 1]

    for i in range(len(arr), 0, -1):
        B[C[arr[i - 1]] - 1] = arr[i - 1]
        C[arr[i - 1]] -= 1
    return B

在count_sort(arr)的1-2行，我们初始化数组 $B$ 和 $C$ ，第一个for循环统计了arr中每个元素的个数并将其存放到 $C$ ，第二个for循环将 $C$ 中统计的数值转变为累计值，最后一个for循环将结果arr的排序结果保存到 $B$ 。现在我们来看看整个过程：
计数排序的过程
计数排序的下界优于我们在《排序算法：比较排序算法的下界》中所证明的 $\Omega(n\lg n)$ ，因为它并不是一个比较排序算法。事实上，它的代码中完全没有输入元素之间的比较操作。相反，计数排序是使用输入元素的实际值来确定其在数组中的位置。当我们脱离了比较排序模型的时候， $\Omega(n\lg n)$ 这一下界就不再适用了。

计数排序的一个重要性质就是它是稳定的：具有相同值的元素在输出数组中的相对次序与它们在输入数组中的相对次序相同。也就是说，对两个相同的数来说，在输入数组中先出现的数，在输出数组中也位于前面。通常，这种稳定性只有当进行排序的数据还附带卫星数据时才比较重要。计数排序的稳定性很重要的另一个原因是：计数排序经常会被用作基数排序算法的一个子过程。我们将在后续的文章中中看到，为了使基数排序正确运行，计数排序必须是稳定的。

最后，我们用动图演示一下插入排序的全过程：
计数排序

von Neumann

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
3
评论
算法设计与分析——排序算法（八）：计数排序

计数排序假设nnn个输入元素中的每一个都是在000到kkk区间内的一个整数，其中kkk为某个整数。当k=O(n)k=O(n)k=O(n)时，排序的运行时间为Θ(n)\Theta(n)Θ(n)。计数排序的基本思想是：对每一个输入元素xxx，确定小于xxx的元素个数。利用这一信息，就可以直接把xxx放到它在输出数组中的位置上了。例如，如果有17个元素小于xxx，则xxx就应该在第18个输出位置上。当有几个元素相同时，这一方案要略做修改。因为不能把它们放在同一个输出位置上。在计数排序算法的代码中，假设输入是一
复制链接

扫一扫