桶排序
和计数排序一样,都是线性时间的排序算法。
每一个桶(bucket)代表一个区间范围,里面可以承载一个或多个元素。
假设有一个非整数数列如下:4.5,0.84,3.25,2.18,0.5。
桶排序的第1步,就是创建这些桶,并确定每一个桶的区间范围。
具体需要建立多少个桶,如何确定桶的区间范围,有很多种不同的方式。我们这里创建的桶数量等于原始数列的元素数量,除最后一个桶只包含数列最大值外,前面各个桶的区间按照比例来确定。
区间跨度 = (最大值-最小值)/ (桶的数量 - 1)
第2步,遍历原始数列,把元素对号入座放入各个桶中。
第3步,对每个桶内部的元素分别进行排序(显然,只有第1个桶需
要排序)。
第4步,遍历所有的桶,输出所有元素。
0.5,0.84,2.18,3.25,4.5
到此为止,排序结束。
上代码:
public static double[] bucketSort(double[] array){
//1.得到数列的最大值和最小值,并算出差值d
double max = array[0];
double min = array[0];
for(int i=1; i<array.length; i++) {
if(array[i] > max) {
max = array[i];
}
if(array[i] < min) {
min = array[i];
}
}
double d = max - min;
//2.初始化桶,使用LinkedList的原因是链表添加元素速度较快
int bucketNum = array.length;
ArrayList<LinkedList<Double>> bucketList = new ArrayList<LinkedList<Double>>(bucketNum);
for(int i = 0; i < bucketNum; i++){
bucketList.add(new LinkedList<Double>());
}
//3.遍历原始数组,将每个元素放入桶中
for(int i = 0; i < array.length; i++){
int num = (int)((array[i] - min) * (bucketNum-1) / d);
bucketList.get(num).add(array[i]);
}
//4.对每个桶内部进行排序
for(int i = 0; i < bucketList.size(); i++){
//JDK底层采用了归并排序或归并的优化版本
Collections.sort(bucketList.get(i));
}
//5.输出全部元素
double[] sortedArray = new double[array.length];
int index = 0;
for(LinkedList<Double> list : bucketList){
for(double element : list){
sortedArray[index] = element;
index++;
}
}
return sortedArray;
}
public static void main(String[] args) {
double[] array = new double[] {4.12,6.421,0.0023,3.0,2.123,8.122,4.12, 10.09};
double[] sortedArray = bucketSort(array);
System.out.println(Arrays.toString(sortedArray));
}
时间复杂度分析:
假设原始数列有n个元素,分成n个桶。
下面逐步来分析一下算法复杂度。
第1步,求数列最大、最小值,运算量为n。
第2步,创建空桶,运算量为n。
第3步,把原始数列的元素分配到各个桶中,运算量为n。
第4步,在每个桶内部做排序,在元素分布相对均匀的情况下,所有桶的运算量之和为n。
第5步,输出排序数列,运算量为n。
因此,桶排序的总体时间复杂度为O(n)。
在极端的情况之下,如下所示,此时的时间复杂度将退化为O(nlogn),而且还白白创建了许多空桶。
至于空间复杂度就很容易得到了,同样是O(n)。