一、原理
从整数元素的最低位(个位)开始,按照个位元素的值进行排序,得到一个排序结果,然后再根据此结果,在元素的十位上的元素进行排序,得到下一个结果。之后继续往高位进行这样的排序,最高位排序后得到的结果就是最终有序的数组。
整个过程就如下图所示,原数组为{122,342,98,6,101},最高位(百位)的排序结果就是最终的有序数组,每一次排序都是建立在上一次排序结果的基础上。
可以看到下面的98和6进行了补齐操作,这是因为当位数不同时我们得想办法让他们位数相同,好进行后面的排序操作。那就在数字前面补0,总不能在后面补吧,那样是不对的。
对于基数排序有了初步了解之后,我们来探究它是如何实现的。其实基数排序必须依赖于另外的排序方法,像这里我们就借助了桶排序来完成基数排序的操作。这里的桶排序和真正的桶排序不太一样,但方法类似。
如图,有一个无序数组 arr={53,3,542,748,14,214}。对于十进制数来说,其组成就是0-9这10个数字,因此这里我们设置了10个桶,桶对应的标识数字为0-9。
第一步,从前往后遍历数组arr的所有元素,当遍历到n时,看n个位上的数字是什么,将其放入对应数字标识的桶中。得到第一个排序结果。如图,数字都已放入桶中。然后按照0-9的桶的顺序,将桶里面的数字取出,按序赋值到数组arr中。
第二步,从前往后遍历数组arr的所有元素,当遍历到n时,看n十位上的数字是什么,将其放入对应数字标识的桶中。得到第二个排序结果。如图,数字都已放入桶中。然后按照0-9的桶的顺序,将桶里面的数字取出,按序赋值到数组arr中。
第三步,从前往后遍历数组arr的所有元素,当遍历到n时,看n百位上的数字是什么,将其放入对应数字标识的桶中。得到第三个排序结果。如图,数字都已放入桶中。然后按照0-9的桶的顺序,将桶里面的数字取出,按序赋值到数组arr中。
我们一共做了3步操作,对应着这个数组中最大数组的位数3。可以看到,这三步操作简直一模一样,只有每次比较的位不一样。
二、实现代码示例
package Sort;
import java.util.Arrays;
public class RadixSort {
public static void main(String[] args) {
int[] arr = new int[]{53,3,542,748,14,214};
System.out.println("基数排序前:" + Arrays.toString(arr));
radixSort(arr);
System.out.println("基数排序后:" + Arrays.toString(arr));
}
/**
* 获取数组arr中元素的最大位数
* @param arr
* @return
*/
public static int getMaxElementDigits(int[] arr){
// 找到数组arr中的最大元素,最大元素的位数也是最大的
int max = arr[0];
for (int i = 0; i < arr.length; i++) {
if (arr[i] > max){
max = arr[i];
}
}
// 求位数maxElementDigits的另个方法 int maxElementDigits = (max + "").length();
return String.valueOf(max).length();
}
/**
* 利用桶排序实现基数排序
* @param arr
*/
public static void radixSort(int[] arr){
int[][] buckets = new int[10][arr.length]; // buckets就是0-9对应的桶。这里设置为二维数组,相同桶中可以存储多个元素
int[] bucketElementCount = new int[10]; // 主要是为了记录每个桶中的元素数量,便于最后返回
int maxElementDigits = getMaxElementDigits(arr); // 获取最大位数,
// 假设最大位数有k位,则这个循环的时间复杂度为O(nk),当位数比较小时,近似于O(n)
int factor = 1; // 设置factor初值为1,方便后面改变比较的位
for (int i = 0; i < maxElementDigits; i++) {
// 遍历arr,将arr中的元素放入对应bucket
for (int j = 0; j < arr.length; j++) {
int digitOfElement = arr[j] / factor % 10; // 计算此次循环比较的位,用到了factor
buckets[digitOfElement][bucketElementCount[digitOfElement]] = arr[j]; // 把arr[j]放入bucket数组的最后一位
bucketElementCount[digitOfElement]++; // 新放入元素的桶中元素数量+1
}
// 遍历所有桶,将bucket中的元素按顺序放回原数组arr,即排序结果赋值回arr,作为下一次排序的数组
int index = 0; // index用于arr索引
for (int k = 0; k < buckets.length; k++) {
if(bucketElementCount[k] != 0){
for (int count = 0; count < bucketElementCount[k]; count++) { // bucketElementCount[k]为第k-1个桶里的元素数量
arr[index++] = buckets[k][count];
}
}
bucketElementCount[k] = 0; // 这里重置是因为有多次循环,下一次排序中还会用到bucketElementCount
}
factor *= 10; // 进位,下一次digitOfElement计算结果就是更高位
}
}
}
三、算法分析
1.特点与应用场景
基数排序是对桶排序的扩展,速度很快;
它是以空间换时间的算法,占用内存很大,当对海量数据排序时,容易造成OutOfMenoryError;
基数排序是稳定的,因为它在排高位时需要考虑低位的排序结果,如果实现出来的代码是不稳定排序,那么低位排序结果也就没有意义;
如果有负数就不能用基数排序,如果需要,参考 https://code.i-harness.com/zh-CN/q/e98fa9
基数排序对要排序的数据是有要求的,需要可以分割出**独立的“位”**来比较,而且位之间有递进的关系,如果 a 数据的高位比 b 数据大,那剩下的低位就不用比较了。
数据每一位的范围不能太大,要可以用线性排序算法来排序,否则,基数排序的时间复杂度就无法做到 O(n) 了。
2.效率分析
平均时间复杂度 | 最好时间复杂度 | 最坏时间复杂度 | 空间复杂度 | 排序方式 | 稳定性 |
---|---|---|---|---|---|
O(n*k) | O(n*k) | O(n*k) | O(n+k) | Out-place | 稳定 |
k:所有元素中位数最大的元素位数
空间复杂度:桶可以装下最多元素个数为10*n,再加上一个计数的数组长度为k。