关于计数排序的思考


最简单的理解,先不考虑最大值和最小值问题。如果有n个数,数值范围在0~100,放在数组a中。申请一个长度为101的数组c(数组里的数默认都填充了0)。遍历一遍数组a,值是多少,就在c[值]中加1。然后再遍历一遍数组c,从第二项开始,自己=自己+前面一项。这样相当于计数,让c的意义变成:角标代表一个数,这个数在数组a中有多少小于等于它的数。现在申请一个数组b,从末尾遍历一遍数组a(为了稳定性,所以才从末尾遍历的),查数在数组c中计数是多少,放在数组b中(数组从0开始,所以放在b[c值-1]的位置。因为这个数放置好了,所以计数也应该减一,即c值=c值-1。这两句可以合并成一句b[--c值]。因为--i是先把减1再赋值。)遍历一遍后,数组b就已经是排序好的了。
再来考虑最大值最小值的问题,遍历一遍a即可找到最大值最小值。如果a中数的范围是50~100,那么申请的c中角标是0~49中的数一定是0,没有意义。所以可以采用差值的方法,c角标的含义是:数-最小值。c的大小变成了最大值-最小值+1(加1是因为最小值-最小值等于0)。实现方式跟上面一样,只要注意加减最小值就好。计数排序是针对非负整数的,当数中的最大值和最小值相差不大的时候最好用。计数排序要求元素能够作为数组的下标,自然不能是负数。我的思路是先把负数和非负数分离开来,对负数取绝对值,再对这两组数分别计数排序,最后再把两组数合并。对于浮点数暂时还没有想到好的解决方案。

	public static int[] sort(int[]a){
		int b[]=new int[a.length];
		int max=a[0],min=a[0];
		for(int i:a){//找到最大最小值
			if(i>max){
				max=i;
			}
			if(i<min){
				min=i;
			}
		}
		int k=max-min+1;//数组长度是极值差+1,因为最小值-最小值=0,范围是0~最大值-最小值
		int c[]=new int[k];
		for(int i=0;i<a.length;i++){
			c[a[i]-min]+=1;//值-最小值
		}
		for(int i=1;i<c.length;i++){//计数,c角标代表:值-最小值,c中数代表有多少个不大于这个值的数。
			c[i]=c[i]+c[i-1];
		}
		for(int i=a.length-1;i>=0;--i){//找到a[i]应该在什么位置,根据有多少个数不大于a[i]。
			b[--c[a[i]-min]]=a[i];//b从0开始放,所以是计数-1;数被放置好了,计数应该-1
		}
		return b;
	}

不过,既然我有了数组c了,数组c的角标就是值-最小值。我只要遍历一遍c,从头到尾,c中的数是几我就输出几遍c的角标+最小值。我还计数干啥啊。这样不论是时间还是空间都化简了,还好理解。这种方法可以看做是化简桶排序。所以计数排序的存在意义是什么?为什么查算法总结,很多人都带上了计数排序?

经查找,我发现下面这种排序叫鸽巢排序。

    public static void sort(int[]a){
        //int b[]=new int[a.length];
        int max=a[0],min=a[0];
        for(int i:a){//找到最大最小值
            if(i>max){
                max=i;
            }
            if(i<min){
                min=i;
            }
        }
        int k=max-min+1;//数组长度是极值差+1,因为最小值-最小值=0,范围是0~最大值-最小值
        int c[]=new int[k];
        for(int i=0;i<a.length;i++){
            c[a[i]-min]+=1;//值-最小值
        }
        int j=0;
        for(int i=0;i<c.length;i++){//c中的数表示有几个“角标+最小值”那么大的数
        	while(c[i]>0){
        		a[j]=i+min;//一个个数从小到大放到a中
        		j++;
        		c[i]--;
        	}
        }
    }

鸽巢排序看起来适用性跟计数排序完全一样,且简单、高效、节省空间。但为什么大家提的都是计数排序,很少有说鸽巢排序的?

排序算法的稳定性是指相同的数在排序过后前后顺序不变。我认为排序算法的稳定性意义:如果排的不是整数,比如排的是学生,先按学号排序,再按成绩排序。如果排序算法是稳定的,那么排出来的效果是相同成绩的学生按学号排序了。如果算法不稳定,排出来的效果是相同成绩的学生随便排序。计数排序只能排整数,那么为什么要在乎它的稳定性?是我对稳定性的意义理解错了?还是计数排序不只是能排整数?如果是第二个原因,也就可以理解为什么普遍了解的都是计数排序了。但是,计数排序如何实现对其他类型进行排序呢?

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
计数排序(Counting Sort)是一种非比较型整数排序算法,它对输入的数据进行计数,然后根据计数值直接输出排序结果。计数排序适用于数据规模较小且数据分布均匀的情况,它的时间复杂度为O(n+k),其中n是输入数据的数量,k是输入数据的最大值。 在Python中实现计数排序的代码示例如下: ```python def counting_sort(arr): # 确定最大值和计数数组的长度 max_val = max(arr) count_len = max_val + 1 # 初始化计数数组 count = * count_len # 统计每个元素出现的次数 for num in arr: count[num] += 1 # 计算每个元素应该放置的位置 for i in range(1, count_len): count[i] += count[i-1] # 创建输出数组并排序 output = * len(arr) for num in arr: output[count[num]-1] = num count[num] -= 1 return output ``` 上述代码中,我们首先确定输入数组中的最大值,并根据最大值创建一个计数数组,长度为最大值加一。然后统计输入数组中每个元素出现的次数,并将计数结果存入计数数组。接下来,我们通过累加计数数组中的元素,计算每个元素应该放置的位置。最后,我们根据计数数组中的计数值和位置信息,将输入数组中的元素排序并输出。 使用计数排序算法对整数数组进行排序的时间复杂度为O(n+k),空间复杂度为O(n)。在Python中实现计数排序算法时,需要占用一定的额外空间来存储计数数组和输出数组。但是,计数排序算法的稳定性较好,适用于整数数组的排序。在实际应用中,需要根据具体的数据规模和分布情况选择合适的排序算法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值