计数排序是一种算法复杂度 O(n) 的排序方法,适合于小范围集合的排序。比如100万学生参加高考,我们想对这100万学生的数学成绩(假设分数为0到100)做个排序。我们如何设计一个最高效的排序算法。本文不光给出计数排序算法的传统写法,还将一步步深入讨论算法的优化,直到时间复杂度和空间复杂度最优。
计数排序是一个类似于桶排序的排序算法,其优势是对已知数量范围的数组进行排序。它创建一个长度为这个数据范围的数组C,C中每个元素记录要排序数组中对应记录的出现个数。这个算法于1954年由 Harold H. Seward 提出。
计数排序的基本思想是对每个输入元素x,确定出小于x的元素个数,有了这一信息就可以把x直接放到它在最终输出数组的位置上,由于算法导论上写的比较复杂,这里用自己的代码来实现计数排序:
这里有一个注意的地方:就是在排序过程中生成的两个临时数组的大小是length,其实应该是以原始数组中最大的元素为数组长度的(如果最大元素小于原始数组长度则临时长度为原始数组长度),但是找出最大元素又要耗时O(n).
c++代码:
#include <stdio.h>
#include <stdlib.h>
//计数排序
int CountSort(int* pData,int nLen)
{
int* pCout= new int[length] //初始化记数为0
for (int i=0; i< nLen;++i)
{
pCout[i] =0;
}
//记录排序记数。在排序的值相应记数加1。
for (int i=0; i< nLen;++i)
{
++pCout[pData[i]];
}
//确定不比该位置大的数据个数。
for (int i=1; i< nLen;++i)
{
pCout[i] += pCout[i-1]; //不比他大的数据个数为他的个数加上前一个的记数。
}
int* pSort= new int[length];
for (int i=0; i< nLen;++i)
{
//把数据放在指定位置。因为pCout[pData[i]]的值就是不比他大数据的个数。
//为什么要先减一,因为pCout[pData[i]]保存的是不比他大数据的个数中包括了
//他自己,我的下标是从零开始的!所以要先减一。
--pCout[pData[i]]; //因为有相同数据的可能,所以要把该位置数据个数减一。
pSort[pCout[pData[i]]] = pData[i];
}
//排序结束,复制到原来数组中。
for (int i=0; i< nLen;++i)
{
pData[i] = pSort[i];
}
//最后要注意释放申请的空间。
delete []pCout;
delete []pSort;
return 1;
}
int main()
{
int nData[10]= {8,6,3,6,5,8,3,5,1,0};
CountSort(nData, 10);
for (int i=0; i<10;++i)
{
printf("%d", nData[i]);
}
printf("\n");
system("pause");
return 0;
}