计数排序
计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序。
计数排序要求输入的数据必须是有确定范围的整数,该范围是已知的。
当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 Θ(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。
由于用来计数的数组C的长度取决于待排序数组中数据的范围(待排序数组的长度要大于待排序的数组元素),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。
例如:计数排序是用来排序0到100之间的数字的最好的算法,但是它不适合按字母顺序排序人名。但是,计数排序可以用在基数排序中的算法来排序数据范围很大的数组。
通俗地理解,例如有 10 个年龄不同的人,统计出有 8 个人的年龄比 A 小,那 A 的年龄就排在第 9 位,用这个方法可以得到其他每个人的位置,也就排好了序。当然,年龄有重复时需要特殊处理(保证稳定性,计算cdf),这就是为什么最后要反向填充目标数组,以及将每个数字的统计减去 1 的原因。
1. 算法步骤
- 找出待排序的数组中最大和最小的索引(只是确保数组长度大于所有数据元素)
- 统计数组中每个值为i的元素出现的次数,存入数组C的第i项
- 对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加)
- 反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1
2. 动图演示
3.代码实现
void print_arr(int* arr, int n) {
int i;
printf("%d", arr[0]);
for (i = 1; i < n; i++)
printf(" %d", arr[i]);
printf("\n");
}
void counting_sort(int* ini_arr, int* sorted_arr, int n) {
int* count_arr = (int*)malloc(sizeof(int) * 100);//数组的大小大于
int i, j, k; //所有待排序的数组元素(0~99)
for (k = 0; k < 100; k++)//先进行清0,memset函数也可以
count_arr[k] = 0;
for (i = 0; i < n; i++)//根据数组元素值放入count_arr相应的索引当中
count_arr[ini_arr[i]]++;
for (k = 1; k < 100; k++)//进行累加,效果相当于cdf
count_arr[k] += count_arr[k - 1];
for (j = n; j > 0; j--)//反向填充目标数组
sorted_arr[--count_arr[ini_arr[j - 1]]] = ini_arr[j - 1];
free(count_arr);//释放内存
}
void main(int argc, char** argv) {
int n = 10;//待测试的数据量
int i;
int* arr = (int*)malloc(sizeof(int) * n);
int* sorted_arr = (int*)malloc(sizeof(int) * n);
srand(time(0));
for (i = 0; i < n; i++)
arr[i] = rand() % 100;//随机生成10个介于0~99的正整数
printf("ini_array: ");
print_arr(arr, n);//排序前数组元素的顺序
counting_sort(arr, sorted_arr, n);//进行计数排序
printf("sorted_array: ");
print_arr(sorted_arr, n);//排序后数组元素的顺序
free(arr);//释放内存
free(sorted_arr);
system("pause");
}