分类目录:《算法设计与分析》总目录
相关文章:
· 排序算法(一):插入排序
· 排序算法(二):归并排序
· 排序算法(三):堆排序
· 排序算法(四):选择排序
· 排序算法(五):冒泡排序
· 排序算法(六):希尔排序
· 排序算法(七):快速排序
\qquad
· ①基础知识
\qquad
· ②快速排序的性能
\qquad
· ③快速排序的随机化
\qquad
· ④快速排序的分析
· 排序算法(八):计数排序
· 排序算法(九):基数排序
· 排序算法(十):桶排序
· 排序算法:比较排序算法的下界
· 排序算法:十大排序算法总结
计数排序假设 n n n个输入元素中的每一个都是在 0 0 0到 k k k区间内的一个整数,其中 k k k为某个整数。当 k = O ( n ) k=O(n) k=O(n)时,排序的运行时间为 Θ ( n ) \Theta(n) Θ(n)。
计数排序的基本思想是:对每一个输入元素 x x x,确定小于 x x x的元素个数。利用这一信息,就可以直接把 x x x放到它在输出数组中的位置上了。例如,如果有17个元素小于 x x x,则 x x x就应该在第18个输出位置上。当有几个元素相同时,这一方案要略做修改。因为不能把它们放在同一个输出位置上。
在计数排序算法的代码中,假设输入是一个数组 A [ 1 ⋯ n ] A[1\cdots n] A[1⋯n],我们还需要两个数组: B [ 1 ⋯ n ] B[1\cdots n] B[1⋯n]存放排序的输出, C [ 1 ⋯ k ] C[1\cdots k] C[1⋯k]提供临时存储空间。
def count_sort(arr):
B = [0] * len(arr)
C = [0] * (max(arr) + 1)
for i in arr:
C[i] += 1
for i in range(1, max(arr) + 1):
C[i] += C[i - 1]
for i in range(len(arr), 0, -1):
B[C[arr[i - 1]] - 1] = arr[i - 1]
C[arr[i - 1]] -= 1
return B
在count_sort(arr)
的1-2行,我们初始化数组
B
B
B和
C
C
C,第一个for
循环统计了arr
中每个元素的个数并将其存放到
C
C
C,第二个for
循环将
C
C
C中统计的数值转变为累计值,最后一个for
循环将结果arr的排序结果保存到
B
B
B。现在我们来看看整个过程:
计数排序的下界优于我们在《排序算法:比较排序算法的下界》中所证明的
Ω
(
n
lg
n
)
\Omega(n\lg n)
Ω(nlgn),因为它并不是一个比较排序算法。事实上,它的代码中完全没有输入元素之间的比较操作。相反,计数排序是使用输入元素的实际值来确定其在数组中的位置。当我们脱离了比较排序模型的时候,
Ω
(
n
lg
n
)
\Omega(n\lg n)
Ω(nlgn)这一下界就不再适用了。
计数排序的一个重要性质就是它是稳定的:具有相同值的元素在输出数组中的相对次序与它们在输入数组中的相对次序相同。也就是说,对两个相同的数来说,在输入数组中先出现的数,在输出数组中也位于前面。通常,这种稳定性只有当进行排序的数据还附带卫星数据时才比较重要。计数排序的稳定性很重要的另一个原因是:计数排序经常会被用作基数排序算法的一个子过程。我们将在后续的文章中中看到,为了使基数排序正确运行,计数排序必须是稳定的。
最后,我们用动图演示一下插入排序的全过程: