计数排序(Counting Sort)
一、基本思想
计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。它的基本思想是:给定的输入序列中的每一个元素 x x x,确定该序列中值小于等于 x x x 元素的个数,然后将 x x x 直接存放到最终的排序序列的正确位置上。
二、实现逻辑
由于用来计数的数组count
的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。
算法步骤:
- 找出待排序的数组种最大和最小的元素;
- 统计数组中每个值为
i
i
i 的元素出现的次数,存入数组
count
的第 i i i 项; - 对所有的计数累加(从
count
中的第一个元素开始,每一项和前一项相加),为了直接求得元素的位置; - 反向填充目标数组:将每个元素
i
i
i 放在新数组的第
count[i]
项,每放一个元素就将count[i]
减去1。
三、时间复杂度的分析
遍历数组进行计数操作产生了 Ω ( n ) \Omega(n) Ω(n)、 O ( n ) O(n) O(n)、 Θ ( n ) \Theta(n) Θ(n)的时间复杂度,对计数数组进行前缀和操作产生了 Ω ( k ) \Omega(k) Ω(k)、 O ( k ) O(k) O(k)、 Θ ( k ) \Theta(k) Θ(k)的时间复杂度,进行反向填充操作同样产生了 Ω ( n ) \Omega(n) Ω(n)、 O ( n ) O(n) O(n)、 Θ ( n ) \Theta(n) Θ(n)的时间复杂度。综上所述: Ω ( n + k ) \Omega(n+k) Ω(n+k)、 O ( n + k ) O(n+k) O(n+k)、 Θ ( n + k ) \Theta(n+k) Θ(n+k), n n n 前常数可以忽略。
四、空间复杂度的分析
由于额外开辟了大小为k = max(array) - min(array) + 1
的数组,所以空间复杂度为:
O
(
k
)
O(k)
O(k)。在算法实现中开辟了另外一个用于存储记录的列表result
。
五、算法实现
while循环
def counting_sort(array: List[int], reverse: bool=False) -> None:
'''
array: 仅支持全为整数类型的数据。
reverse: 是否降序, 默认采用升序。
'''
if not array:
return None
arrmin = min(array)
arrmax = max(array)
count = [0] * (arrmax - arrmin + 1)
for value in array:
count[value - arrmin] += 1
pos = len(array) - 1 if reverse else 0 # 游标
for index in range(arrmin, arrmax + 1): # 从最小的数开始
amount = count[index - arrmin]
while amount >= 1:
array[pos] = index
amount -= 1
pos = pos - 1 if reverse else pos + 1
enumerate函数
def counting_sort(array: List[int], reverse: bool=False) -> None:
'''
array: 仅支持全为整数类型的数据。
reverse: 是否降序, 默认采用升序。
'''
if not array:
return None
arrmin = min(array)
arrmax = max(array)
count = [0] * (arrmax - arrmin + 1)
for value in array:
count[value - arrmin] += 1
array.clear()
for index, val in enumerate(count):
for _ in range(val):
_ = array.insert(0, index + arrmin) if reverse else array.append(index + arrmin)
反向填充
反向填充是为了维持排序算法的稳定性:
def counting_sort(array: List[int], reverse: bool=False) -> List[int]:
'''
array: 仅支持全为整数类型的数据。
reverse: 是否降序, 默认采用升序。
'''
if not array:
return array
arrmin = min(array)
arrmax = max(array)
length = len(array)
count = [0] * (arrmax - arrmin + 1)
result = [0] * length
for value in array:
count[value - arrmin] += 1
for index in range(1, arrmax - arrmin + 1):
count[index] += count[index - 1]
for index in range(len(array) - 1, -1, -1):
pos = count[array[index] - arrmin]
result[length - pos if reverse else pos - 1] = array[index]
pos -= 1
return result