什么是计数排序？

最新推荐文章于 2024-08-05 20:49:33 发布

置顶一个crud的码农

最新推荐文章于 2024-08-05 20:49:33 发布

阅读量882

点赞数 2

分类专栏：技术文章标签：算法

本文链接：https://blog.csdn.net/qq_34277344/article/details/103044748

版权

技术专栏收录该内容

12 篇文章 0 订阅

订阅专栏

计数排序

 一个不是基于元素比较，而是利用数组下标来确定元素的正确位置。

我们来看一个例子，假设有20个随机整数，取值范围为0到10，我们会用是排序算法？
无论是快速排序，还是冒泡排序 等等，都是基于元素之间的比较来进行排序的。

看到这里可能会有同学问，排序当然是要先比较呀。

今天我们就来看一个不用比较的排序。

还是上面的例子，1-10的范围内，有20个整数，那取值范围自然就是0,1,2,3,4,5,6,7,8,9,10这11个数。

那我们就建立一个长度为11的数组，数组下标从0到10，元素初始值都为0。
在这里插入图片描述
假定20个随机整数的值如下：

9，3，5，4，9，1，2，7，8，1，3，6，5，3，4，0，10，9 ，7，9

如何给这些无序的随机整数排序呢？

非常简单，让我们遍历这个无序的随机数列，每一个整数按照其值对号入座，对应数组下标的元素进行加1操作。

比如第一个整数是9，那么数组下标为9的元素加1：
在这里插入图片描述
第二个整数是3，那么数组下标为3的元素加1：

继续遍历数列并修改数组…

最终，数列遍历完毕时，数组的状态如下：
在这里插入图片描述
数组每一个下标位置的值，代表了数列中对应整数出现的次数。

有了这个“统计结果”，排序就很简单了。直接遍历数组，输出数组元素的下标值，元素的值是几，就输出几次：

0，1，1，2，3，3，3，4，4，5，5，6，7，7，8，9，9，9，9，10

显然，这个输出的数列已经是有序的了。

以上就是基数排序的过程，它适用于一定范围整数排序，再取值范围不是很大的情况下，他的性能甚至快过那些o(nlogn)的排序。

下面我们来看下代码是怎么实现的。

public static int[] countSort(int[] array){
		//1.获取数列中的最大值
		int max = array[0];
		for (int i = 0; i < array.length; i++) {
            if(array[i] > max){
            	max = array[i];
            }
        }

        //2.创建统计数组并统计对应元素
        int[] countArray = new int[max + 1];
        for (int i = 0; i < array.length; i++) {
            countArray[array[i] - min]++;
        }

        //3.遍历原始数组，从统计数组找到正确的位置，输出结果数组
        int index = 0;
        int[] sortedArray = new int[array.length];
        for (int i = 0; i < countArray.length; i++) {
            for (int j = 0; j < countArray[i]; j++) {
            	sortedArray[index++] =  i;
        	}
        }

        return sortedArray;
    }

这段代码在一开头补充了一个步骤，就是求得数列的最大整数值max。后面创建的统计数组countArray，长度就是max+1，以此保证数组的最后一个下标是max。

或许有的同学已经看出来这段代码存在的问题了。

如果数列是：95，94，91，98，99，90，99，93，91，92
那这个数列的最大值是99，但最小的是90，如果创建长度为100的数组，前面0到89的空间位置都浪费了。

那怎么解决这个问题呢？
很简单，我们不再以（输入数列的最大值+1）作为统计数组的长度，而是以（数列最大值和最小值的差+1）作为统计数组的长度。

同时，数列的最小值作为一个偏移量，用于统计数组的对号入座。

以刚才的数列为例，统计数组的长度为 99-90+1 = 10 ，偏移量等于数列的最小值 90 。

对于第一个整数95，对应的统计数组下标是 95-90 = 5，如图所示：
在这里插入图片描述
不错，我们已经解决了一个问题，但是还有没有其他问题呢？如果上述代码放到业务里，比如给学生的考试分数排序，遇到相同的分数就会分不清谁是谁。

什么意思呢？让我们看看下面的例子：

在这里插入图片描述
给定一个学生的成绩表，要求按成绩从低到高排序，如果成绩相同，则遵循原表固有顺序。

那么，当我们填充统计数组以后，我们只知道有两个成绩并列95分的小伙伴，却不知道哪一个是小红，哪一个是小绿：

在这里插入图片描述
下面的讲解会有一些烧脑，请大家扶稳坐好。我们仍然以刚才的学生成绩表为例，把之前的统计数组变形成下面的样子：

这是如何变形的呢？统计数组从第二个元素开始，每一个元素都加上前面所有元素之和。

为什么要相加呢？初次看到的小伙伴可能会觉得莫名其妙。

这样相加的目的，是让统计数组存储的元素值，等于相应整数的最终排序位置。比如下标是9的元素值为5，代表原始数列的整数9，最终的排序是在第5位。

接下来，我们创建输出数组sortedArray，长度和输入数列一致。然后从后向前遍历输入数列：

第一步，我们遍历成绩表最后一行的小绿：

小绿是95分，我们找到countArray下标是5的元素，值是4，代表小绿的成绩排名位置在第4位。

同时，我们给countArray下标是5的元素值减1，从4变成3,，代表着下次再遇到95分的成绩时，最终排名是第3。
在这里插入图片描述
第二步，我们遍历成绩表倒数第二行的小白：

小白是94分，我们找到countArray下标是4的元素，值是2，代表小白的成绩排名位置在第2位。

同时，我们给countArray下标是4的元素值减1，从2变成1,，代表着下次再遇到94分的成绩时（实际上已经遇不到了），最终排名是第1。
在这里插入图片描述
第三步，我们遍历成绩表倒数第三行的小红：

小红是95分，我们找到countArray下标是5的元素，值是3（最初是4，减1变成了3），代表小红的成绩排名位置在第3位。

同时，我们给countArray下标是5的元素值减1，从3变成2,，代表着下次再遇到95分的成绩时（实际上已经遇不到了），最终排名是第2。
在这里插入图片描述

这样一来，同样是95分的小红和小绿就能够清楚地排出顺序了，也正因此，优化版本的计数排序属于稳定排序。

后面的遍历过程以此类推，这里就不再详细描述了。

下面我们看下代码是怎么实现的

public static int[] countSort(int[] array){
        //1.得到数组的最大值与最小值,并且得到差值
        int max = array[0];
        int min = array[0];
        for (int i = 0; i < array.length; i++) {
            if(max < array[i]){
                max = array[i];
            }
            if(min > array[i]){
                min = array[i];
            }
        }
        int d = max - min;

        //2.创建统计数组并统计对应元素
        int[] countArray = new int[d + 1];
        for (int i = 0; i < array.length; i++) {
            countArray[array[i] - min] ++;
        }

        //3.统计数组做变性，后面的元素等于前面元素之和
        int sum = 0;
        for (int i = 0; i < countArray.length; i++) {
            sum += countArray[i];
            countArray[i] = sum;
        }

        //4.遍历原始数组，从统计数组找到正确的位置，输出结果数组
        int[] sortedArray = new int[array.length];
        for (int i = array.length-1; i >= 0; i--) {
            sortedArray[countArray[array[i] - min] - 1]=array[i];
            countArray[array[i] - min]--;
        }

        return sortedArray;
    }

这里有的同学可能会问，基数排序这么强大，为什么很少被大家使用到呢？

因为基数排序存在它的局限性，主要表现在两点：

1.当数列最大最小值差距过大时，并不适用计数排序。

比如给定20个随机整数，范围在0到1亿之间，这时候如果使用计数排序，需要创建长度1亿的数组。不但严重浪费空间，而且时间复杂度也随之升高。

2.当数列元素不是整数，并不适用计数排序。

如果数列中的元素都是小数，比如25.213，或是0.00000001这样子，则无法创建对应的统计数组。这样显然无法进行计数排序。

对于这些局限性，我查了下，另一种线性时间排序算法做出了弥补，这种排序算法叫做桶排序，我先研究下，后续会给大家更新。

一个crud的码农

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
什么是计数排序？

计数排序一个不是基于元素比较，而是利用数组下标来确定元素的正确位置。我们来看一个例子，假设有20个随机整数，取值范围为0到10，我们会用是排序算法？无论是快速排序，还是冒泡排序等等，都是基于元素之间的比较来进行排序的。看到这里可能会有同学问，排序当然是要先比较呀。今天我们就来看一个不用比较的排序。还是上面的例子，1-10的范围内，有20个整数，那取值范围自然就是0,1,2,3,4...
复制链接

扫一扫