线性排序算法-计数排序

最新推荐文章于 2023-05-11 14:09:41 发布

码农随笔

最新推荐文章于 2023-05-11 14:09:41 发布

阅读量442

点赞数

分类专栏：算法基础文章标签：排序算法算法

本文链接：https://blog.csdn.net/ycb1914845451/article/details/114853304

版权

算法同时被 2 个专栏收录

34 篇文章 1 订阅

订阅专栏

基础

27 篇文章 0 订阅

订阅专栏

我们前面分析过几种排序算法，时间复杂度为O（ $n^{2}$ ）如冒泡排序，插入排序和选择排序等，时间复杂度为O(nlogn)，如归并排序和快速排序等，接下来我们来分析一种时间复杂度为O（n）的排序算法。既然存在排序时间复杂度为O（n）的算法，为什么我们还要去分析时间复杂度更高的算法？我们知道每一种排序算法其实都有其限制条件和适用场景。其实计数排序虽然时间复杂度为O（n），但是这种算法有其先决条件，接下来我们来分析下

当要排序的 n 个数据，所处的范围并不大的时候，比如最大值是 k，我们就可以把数据划分成 k 个桶。每个桶内的数据值都是相同的，这样我们遍历一遍数据，把数据划分到每一个桶内，就可以避免桶内的元素再进行排序了。

我们大家都经历过考试，高考时有几千万学生，总成绩都是750分，如果现在要求我们要根据考生的实际分数进行排名。对于这个问题，我们使用计数排序就比较适合，分数有范围范围，0-750。对于这个问题，我们就可以定义750个桶，然后遍历一遍考生的成绩列表，按照分数的大小依次放入相应的桶中，再从桶中依次取出就可以了。接下来我们以一个比较小的数据范围来进行说明，比如成绩在0-5分之间，考生人数是8个。成绩如下。第一个考生的成绩是2分，第二个考生的成绩是5分，依次类推。。

对于这个分数，我们就可以定义6个桶，编号分别为0-5，如下图所示

然后我们遍历一遍考生，把每个分数对应多少考生记录到数组中，如下图。比如，分数为0分的考生有2个，分数为1分的考生有0个，依次类推。

从图中可以看出，分数为 3 分的考生有 3 个，小于 3 分的考生有 4 个，所以，成绩为 3 分的考生在排序之后的有序数组中，会保存下标 4，5，6 的位置。

那我们如何快速计算出，每个分数的考生在有序数组中对应的存储位置呢？这个处理方法非常巧妙，很不容易想到。思路是这样的：我们对桶对应的数组 C 数组顺序求和，C 数组存储的数据就变成了下面这样子。C[k]里存储小于等于分数 k 的考生个数。

得到前面的数据后，我们从后到前依次扫描待排序的数组 A。比如，当扫描到 3 时，我们可以从数组 C 中取出下标为 3 的值 7，也就是说，到目前为止，包括自己在内，分数小于等于 3 的考生有 7 个，也就是说 3 是数组 R 中的第 7 个元素（也就是数组 R 中下标为 6 的位置）。当 3 放入到数组 R 中后，小于等于 3 的元素就只剩下了 6 个了，所以相应的 C[3]要减 1，变成 6。以此类推，当我们扫描到第 2 个分数为 3 的考生的时候，就会把它放入数组 R 中的第 6 个元素的位置（也就是下标为 5 的位置）。当我们扫描完整个数组 A 后，数组 R 内的数据就是按照分数从小到大有序排列的了。

起始时指针指向最后一个元素，经过处理后元素状态如下图

接下来指针向前移动一个元素。如下图所示

指针再继续往前移动一位 C[3] = 6，所以 R[5] = 3 ，同时执行C[3] = C[3] -1

指针再往前移动一位。指针指向的位置为2，C[2] = 4，所以赋值R[3] = 2,同时C[2] = C[2] - 1 ，等于3.

经过一系列的变动，最终变为如下状态，最终R中的数据就是有序的了，把R的数据拷贝会A就可以了。

经过上面的分析，代码如下。

public static void countingSort(int[] nums) {
        if (nums == null || nums.length == 0) return;

        int n = nums.length;

        // 查找数组中数据的范围
        int max = nums[0];
        for (int i = 1; i < n; ++i) {
            if (max < nums[i]) {
                max = nums[i];
            }
        }

        int[] c = new int[max + 1]; // 申请一个计数数组c，下标大小[0,max]
        for (int i = 0; i <= max; ++i) {
            c[i] = 0;
        }

        // 计算每个元素的个数，放入c中
        for (int i = 0; i < n; ++i) {
            c[nums[i]]++;
        }

        // 依次累加
        for (int i = 1; i <= max; ++i) {
            c[i] = c[i - 1] + c[i];
        }

        // 临时数组r，存储排序之后的结果
        int[] r = new int[n];
        // 计算排序的关键步骤，有点难理解
        for (int i = n - 1; i >= 0; --i) {
            int index = c[nums[i]] - 1;
            r[index] = nums[i];
            c[nums[i]]--;
        }

        // 将结果拷贝给a数组
        for (int i = 0; i < n; ++i) {
            nums[i] = r[i];
        }
    }

这种利用另外一个数组来计数的实现方式是不是很巧妙呢？这也是为什么这种排序算法叫计数排序的原因。

计数排序只能用在数据范围不大的场景中，如果数据范围 k 比要排序的数据 n 大很多，就不适合用计数排序了。而且，计数排序只能给非负整数排序，如果要排序的数据是其他类型的，要将其在不改变相对大小的情况下，转化为非负整数。

比如，还是拿考生这个例子。如果考生成绩精确到小数后一位，我们就需要将所有的分数都先乘以 10，转化成整数，然后再放到 9010 个桶内。再比如，如果要排序的数据中有负数，数据的范围是[-1000, 1000]，那我们就需要先对每个数据都加 1000，转化成非负整数。

参考：https://time.geekbang.org/column/article/42038

码农随笔

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线性排序算法-计数排序

我们前面分析过几种排序算法，时间复杂度为O（）如冒泡排序，插入排序和选择排序等，时间复杂度为O(nlogn)，如归并排序和快速排序等，接下来我们来分析一种时间复杂度为O（n）的排序算法。既然存在排序时间复杂度为O（n）的算法，为什么我们还要去分析时间复杂度更高的算法？我们知道每一种排序算法其实都有其限制条件和适用场景。其实计数排序虽然时间复杂度为O（n），但是这种算法有其先决条件，接下来我们来分析下当要排序的 n 个数据，所处的范围并不大的时候，比如最大值是 k，我们就可以把数据划分成 k 个桶。每个桶
复制链接

扫一扫