一、简介
桶排序假设待排序序列的元素服从
[0,1)
间的均匀分布,首先将区间
[0,1)
划分成m个大小相同的子区间,或称为桶。然后将所有元素放在各自所属的区间中。因为序列是均匀分布的,所以各个区间中个元素个数相差不大。然后对每个区间的元素排列,可以用插入排序,因为元素较少,也可用快速排序。然后遍历每个区间,将各个区间的元素遍历即可。这里的区间可以成为桶,所以叫桶排序。
同理,可以对任意有限范围内的元素桶排序,只需要将其所在大区间分成m个小区间。元素的均匀分布和m取值大小决定了桶排序的性能。
桶排序中将所有元素放在其所在的区间中这一做法,其实是将原问题分解成小问题,然后再合并。和归并排序,快速排序的思想一致,不过元素映射到子问题的方式不一样。
二、伪代码
bucketSort(A,m,min,max)
//A是带排序序列,m是桶的个数,min是序列中的最小值,max是序列中的最大值
初始化m个桶
for i=0 to A.length-1
将A[i]插入第 (A[i]-mim)*m/(max-min+1)个桶中
for i=0 to m-1
对第i个桶排序
遍历第i个桶将元素放在输出系列中
三、代码实现
public static void bucketSort(int[] A,int m,int min,int max){
//初始化m个桶,桶的间隔是(max-min+1)/m
ArrayList<ArrayList<Integer>> buckets=new ArrayList<ArrayList<Integer>>(m);
for(int i=0;i<m;i++){
ArrayList<Integer> b=new ArrayList<Integer>();
buckets.add(b);
}
//将序列中的元素插入到对应的桶中
for(int j=0;j<A.length;j++){
int bIndex=(A[j]-min)*m/(max-min+1);
buckets.get(bIndex).add(A[j]);
}
int index=0;
for(int k=0;k<m;k++){
int [] array=new int [buckets.get(k).size()];
for(int j=0;j<array.length;j++){
array[j]=buckets.get(k).get(j);
}
insertionSort(array);
for (int i = 0; i < array.length; i++) {
A[index] = array[i];
index++;
}
}
}
四、注意事项
1、m的值影响桶排序的性能。m=1时,没有将序列分组,即使用插入排序或快速排序;当m=max-min+1时,每个桶里至多有一个元素。但是桶排序需要额外的空间,m越大,需要越多辅助空间。所有选择m需要衡量时间和空间复杂度。
2、待排序列是否在区间内均匀分布直接影响了桶排序的性能。
3、桶排序的平均时间复杂度为线性的O(n+c),其中c为桶内排序的时间复杂度。如果相对于同样的n,桶数量m越大,其效率越高,最好的时间复杂度达到O(n)。 当然桶排序的空间复杂度 为O(n+m),如果输入数据非常庞大,而桶的数量也非常多,则空间代价无疑是昂贵的。