计数排序（Counting Sort）

DeeGLMath

已于 2022-08-06 13:30:13 修改

阅读量1.6k

点赞数

分类专栏：排序算法文章标签：算法数据结构排序算法

于 2022-08-03 21:06:33 首次发布

本文链接：https://blog.csdn.net/linjing_zyq/article/details/126149010

版权

排序算法专栏收录该内容

14 篇文章 1 订阅

订阅专栏

计数排序（Counting Sort）

一、基本思想

计数排序不是基于比较的排序算法，其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序，计数排序要求输入的数据必须是有确定范围的整数。它的基本思想是：给定的输入序列中的每一个元素 $x$ ，确定该序列中值小于等于 $x$ 元素的个数，然后将 $x$ 直接存放到最终的排序序列的正确位置上。

二、实现逻辑

由于用来计数的数组count的长度取决于待排序数组中数据的范围（等于待排序数组的最大值与最小值的差加上1），这使得计数排序对于数据范围很大的数组，需要大量时间和内存。计数排序是用来排序0到100之间的数字的最好的算法，但是它不适合按字母顺序排序人名。

算法步骤：

找出待排序的数组种最大和最小的元素；
统计数组中每个值为 $i$ 的元素出现的次数，存入数组count的第 $i$ 项；
对所有的计数累加（从count中的第一个元素开始，每一项和前一项相加），为了直接求得元素的位置；
反向填充目标数组：将每个元素 $i$ 放在新数组的第count[i]项，每放一个元素就将count[i]减去1。

三、时间复杂度的分析

遍历数组进行计数操作产生了 $\Omega(n)$ 、 $O (n)$ 、 $\Theta(n)$ 的时间复杂度，对计数数组进行前缀和操作产生了 $\Omega(k)$ 、 $O (k)$ 、 $\Theta(k)$ 的时间复杂度，进行反向填充操作同样产生了 $\Omega(n)$ 、 $O (n)$ 、 $\Theta(n)$ 的时间复杂度。综上所述： $\Omega(n+k)$ 、 $O (n + k)$ 、 $\Theta(n+k)$ ， $n$ 前常数可以忽略。

四、空间复杂度的分析

由于额外开辟了大小为k = max(array) - min(array) + 1的数组，所以空间复杂度为： $O (k)$ 。在算法实现中开辟了另外一个用于存储记录的列表result。

五、算法实现

while循环

def counting_sort(array: List[int], reverse: bool=False) -> None:
    '''
    array: 仅支持全为整数类型的数据。
    reverse: 是否降序, 默认采用升序。
    '''
    if not array:
        return None
    arrmin = min(array)
    arrmax = max(array)
    count = [0] * (arrmax - arrmin + 1)
    for value in array:
        count[value - arrmin] += 1
    pos = len(array) - 1 if reverse else 0 # 游标
    for index in range(arrmin, arrmax + 1): # 从最小的数开始
        amount = count[index - arrmin]
        while amount >= 1:
            array[pos] = index
            amount -= 1
            pos = pos - 1 if reverse else pos + 1

enumerate函数

def counting_sort(array: List[int], reverse: bool=False) -> None:
    '''
    array: 仅支持全为整数类型的数据。
    reverse: 是否降序, 默认采用升序。
    '''
    if not array:
        return None
    arrmin = min(array)
    arrmax = max(array)
    count = [0] * (arrmax - arrmin + 1)
    for value in array:
        count[value - arrmin] += 1
    array.clear()
    for index, val in enumerate(count):
        for _ in range(val):
            _ = array.insert(0, index + arrmin) if reverse else array.append(index + arrmin)

反向填充

反向填充是为了维持排序算法的稳定性：

def counting_sort(array: List[int], reverse: bool=False) -> List[int]:
    '''
    array: 仅支持全为整数类型的数据。
    reverse: 是否降序, 默认采用升序。
    '''
    if not array:
        return array
    arrmin = min(array)
    arrmax = max(array)
    length = len(array)
    count = [0] * (arrmax - arrmin + 1)
    result = [0] * length
    for value in array:
        count[value - arrmin] += 1
    for index in range(1, arrmax - arrmin + 1):
        count[index] += count[index - 1]
    for index in range(len(array) - 1, -1, -1):
        pos = count[array[index] - arrmin]
        result[length - pos if reverse else pos - 1] = array[index]
        pos -= 1
    return result