一、基数排序
- 基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,将要排序的元素分配至某些“桶”中,藉以达到排序的作用,基数排序法是属于稳定性的排序,其时间复杂度为O (nlog®m),其中r为所采取的基数,而m为堆数,在某些时候,基数排序法的效率高于其它的稳定性排序法。
二、实现原理(文字+图解)
-
基数排序的发明可以追溯到1887年赫尔曼·何乐礼在打孔卡片制表机(Tabulation Machine)上的贡献。它是这样实现的:将所有待比较数值(正整数)统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。
-
个人感慨:我在学算法时候,一直很崇拜古人的思想,和我们相差几百年,几千年就有如此高深的算法思想,当然古人思想高深不仅体现在这方面,更多的应用于生活,我们学习数据结构和算法也应该如此,代码都是次要的,思想很重要!
阿基米德曾说过:给我一个支点,我将撬起整个地球
图析:
假设:我们现在要对上图 int[]arr = {73,22,…,81}要从小到大排序
步骤如下:
1、对几个数字排序,创建10个桶(数字是0-9),每个桶都是一维数组构成的,桶桶之间就构成了二维数组,下标从0开始
2、第一轮:将arr中每个元素个位取出来,看看元素应该在哪个桶里面,比如:73,个位数是3,那我就放在下标为3的桶里面
3、然后按照桶的顺序,依次取出来数据,放回arr中
(当然,这一轮肯定不会达到元素完全从小到大的要求)
4、第二轮:重复2和3步骤,不过这次是把arr中元素十位取出来
,没有十位的,前面补零(就是放在0下标桶)
-
那进行几轮就完成排序了呢?
答:arr中,位数最高的是什么位,就进行到几轮;
比如:arr = {1,30,20,398};我们可以看到位数最高的是398,百位,所以要进行三轮1 -
分析:
我们可以看到基数排序和要排序数字的位数关系很大,至于数字有多少,我们就有多少桶,且我们不知道桶到底可以要存多少数字,所以每个桶开辟的大小:arr.length;所以说:基数排序是牺牲空间换取效率的算法
代码实现:
public static void radixSort(int []arr){
//定义二维数组表示桶
int[][]arr1 = new int[10][arr.length];
//定义一维数组:记录每个桶元素个数,为后面方面拿出来,放回arr中
int[]arr2 = new int[10];
//得到arr中数字最大数
int max = arr[0];//假设第一个数字最大
for (int i = 1;i<arr.length;i++){
if (arr[i]>max){
max = arr[i];
}
}
//得到最大位数
int maxLength = (max+"").length();
//开始循环排序
for (int i = 0,n=1;i<maxLength;i++,n*=10){
//对每个元素对应位进行排序 个 十 百 千
for (int j = 0;j<arr.length;j++){
//取出每个元素对应位数
int digit = arr[j]/ n % 10;
//放到对应桶中
arr1[digit][arr2[digit]] = arr[j];
arr2[digit]++;
}
//依次从桶取数据,再放回arr中
int index = 0;
for (int i1 = 0;i1<arr2.length;i1++){
//桶中有数据就放回arr
if (arr2[i1]!=0){
for (int j2 = 0;j2<arr2[i1];j2++){
arr[index++] = arr1[i1][j2];
}
}
//处理后,需要把arr2[i1] = 0
arr2[i1] = 0;
}
}
}
我们用随机的80万个数字排序,看看运行时间:
代码:
public static void main(String[] args) {
int []arr = new int[800000];
for (int i = 0;i<800000;i++){
arr[i] = (int)(Math.random()*80000);//生成【0-80000)范围随机数字
}
long time1 = System.currentTimeMillis();
radixSort(arr);
long time2 = System.currentTimeMillis();
long time3 = time2-time1;
System.out.println("排序花费时间:"+time3);
}
运行时间:
真的很恐怖,80万随机数据排序,只需要76毫秒,但效率背后是内存的牺牲。
我们大该可以算下,8千万个数据需要多大内存:
上面的10个桶(数组),加上存放桶元素个数的数组,总工11个数组,长度都是arr.length, 整型int4个字节
80000000* 11 * 4/1024/1024/1024 = 3.28G(约为3.28G)很耗费内存欧,那我们内存可能就不够了。