粗谈桶排序
刚刚看了云栖大会的文章,我大概说说什么是桶排序。(博客图片均来自云栖大会)
桶排序其实就是把一组需要排序的数分成一组一组的,这样的每一组数都放在一个个划分好范围的区间里,这样的区间我们称为一个个桶。
每一个桶(bucket)代表一个区间范围,里面可以承载一个或多个元素。桶排序的第一步,就是创建这些桶,确定每一个桶的区间范围:
具体建立多少个桶,如何确定桶的区间范围,有很多不同的方式。我们这里创建的桶数量等于原始数列的元素数量,除了最后一个桶只包含数列最大值,前面各个桶的区间按照比例确定。
区间跨度 = (最大值-最小值)/ (桶的数量 - 1)
第二步,遍历原始数列,把元素对号入座放入各个桶中:
第三步,每个桶内部的元素分别排序(显然,只有第一个桶需要排序):
第四步,遍历所有的桶,输出所有元素:
0.5,0.84,2.18,3.25,4.5
到此为止,排序结束,主要思想就是划分多个范围相同的区间,每个自区间自排序,最后合并。
下面我们分析一下它的时间复杂度
假设原始数列有n个元素,分成m个桶(我们采用的分桶方式 m=n),平均每个桶的元素个数为n/m。
第一步求数列最大最小值,运算量为n。
第二步创建空桶,运算量为m。
第三步遍历原始数列,运算量为n。
第四步在每个桶内部做排序,由于使用了O(nlogn)的排序算法,所以运算量为 n/m * log(n/m ) * m。
第五步输出排序数列,运算量为n。
加起来,总的运算量为 3n+m+ n/m * log(n/m ) * m = 3n+m+n(logn-logm) 。
去掉系数,时间复杂度为:
O(n+m+n(logn-logm))
至于空间复杂度就很明显了:
空桶占用的空间 + 数列在桶中占用的空间 = O(m+n)。
当桶内元素分布均匀时,m=n,时间复杂度可以达到O(n),但是当桶内元素分布及其不均匀时,时间复杂度最差可以达到O(nlogn),会白白创建许多空桶,由此可见桶排序也不一定快,没有绝对快的排序,任何排序都需要看它的应用场景。
以下是桶排序的核心代码
public static void bucketSort(int[] arr){
// 计算最大值与最小值
int max = Integer.MIN_VALUE;
int min = Integer.MAX_VALUE;
for(int i = 0; i < arr.length; i++){
max = Math.max(max, arr[i]);
min = Math.min(min, arr[i]);
}
// 计算桶的数量
int bucketNum = (max - min) / arr.length + 1;
ArrayList<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketNum);
for(int i = 0; i < bucketNum; i++){
bucketArr.add(new ArrayList<Integer>());
}
// 将每个元素放入桶
for(int i = 0; i < arr.length; i++){
int num = (arr[i] - min) / (arr.length);
bucketArr.get(num).add(arr[i]);
}
// 对每个桶进行排序
for(int i = 0; i < bucketArr.size(); i++){
Collections.sort(bucketArr.get(i));
}
// 将桶中的元素赋值到原序列
int index = 0;
for(int i = 0; i < bucketArr.size(); i++){
for(int j = 0; j < bucketArr.get(i).size(); j++){
arr[index++] = bucketArr.get(i).get(j);
}
}
}
如果发现什么代码bug或者问题,请大家尽管提出!