前言
前面的文章我们简单介绍了数据结构中比较基础常见的七种排序方法,今天我们来介绍一种非比较排序——计数排序。
概述
计数排序是一个非基于比较的排序算法,该算法于1954年由 Harold H. Seward 提出。它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(n+k)(其中k是整数的范围),快于任何比较排序算法。 [1] 当然这是一种牺牲空间换取时间的做法,而且当O(k)>O(n * log(n))的时候其效率反而不如基于比较的排序(基于比较的排序的时间复杂度在理论上的下限是O(n*log(n)), 如归并排序,堆排序)
算法思路
计数排序对输入的数据有附加的限制条件:
1、输入的线性表的元素属于有限偏序集S;
2、设输入的线性表的长度为n,|S|=k(表示集合S中元素的总数目为k),则k=O(n)。
在这两个条件下,计数排序的复杂性为O(n)。
计数排序的基本思想是对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数(此处并非比较各元素的大小,而是通过对元素值的计数和计数值的累加来确定)。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。当然,如果有多个元素具有相同的值时,我们不能将这些元素放在输出序列的同一个位置上,因此,上述方案还要作适当的修改。
排序过程
- 首先确定最大和最小的元素,最大元素减去最小元素的差值即为申请空间的大小。
- 将不同的元素与开辟数组的下标建立一一对应的关系。
- 遍历数组,使用开辟的数组统计每个元素出现的次数。
- 通过下标的关系,得到对应元素之间的大小关系。
- 将待排序集合每一个元素移动到计算得出的正确位置上。
举例解析
先假设 10 个数列为:{9,3,5,7,9,2,4,1,6,8}。
让我们先遍历这个无序的随机数组,找出最大值为 9 和最小值为 1。这样我们对应的计数范围将是 1 ~ 9。然后每一个整数按照其值对号入座,对应数组下标的元素进行加1操作。
比如第一个整数是 9,那么数组下标为 9 的元素加 1,如下图所示。
第二个整数是 3,那么数组下标为 3 的元素加 1,如下图所示。
继续遍历数列并修改数组…。最终,数列遍历完毕时,数组的状态如下图。
数组中的每一个值,代表了数列中对应整数的出现次数。
有了这个统计结果,排序就很简单了,直接遍历数组,输出数组元素的下标值,元素的值是几,就输出几次。比如统计结果中的 19为 2,就是数列中有 2 个 19的意思。这样我们就得到最终排序好的结果。
1,2,3,4,5,6,7,8,9,9
代码实现
void CountSort(int* a, int n)
{
int max = a[0], min = a[0];
for (int i = 0; i < n; i++)
{
if (a[i] > max)
max = a[i];
if (a[i] < min)
min = a[i];
}
int range = max - min + 1;
int* tmp = (int*)calloc(range, sizeof(int));
if (tmp == NULL)
{
perror("calloc");
return;
}
for (int i = 0; i < n; i++)
{
tmp[a[i] - min]++;
}
int j = 0;
for (int i = 0; i < range; i++)
{
while (tmp[i]--)
{
a[j++] = i + min;
}
}
free(tmp);
tmp = NULL;
}
算法性能
时间复杂度
O(n+k)。
空间复杂度
O(k)。
局限性
- 当数列最大最小值差距过大时,并不适用于计数排序
- 当数列元素不是整数时,并不适用于计数排序
总结
以上就是今天要讲的内容,本文简单介绍了计数排序,希望对你有帮助,期待你的一键三连。