桶排序(Bucket Sort)是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。
桶排序的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排
算法描述
- 人为设置一个BucketSize,作为每个桶所能放置多少个不同数值(例如当BucketSize==5时,该桶可以存放{1,2,3,4,5}这几种数字,但是容量不限);
- 遍历输入数据,并且把数据一个一个放到对应的桶里去;
- 对每个不是空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
- 从不是空的桶里把排好序的数据拼接起来。
注意,如果递归使用桶排序为各个桶排序,则当桶数量为1时要手动减小BucketSize增加下一循环桶的数量,否则会陷入死循环,导致内存溢出。
算法图示
算法分析
桶排序最好情况下使用线性时间O(n),桶排序的时间复杂度,取决与对各个桶之间数据进行排序的时间复杂度,因为其它部分的时间复杂度都为O(n)。很显然,桶划分的越小,各个桶之间的数据越少,排序所用的时间也会越少。但相应的空间消耗就会增大。
时间复杂度: 最佳情况:T(n) = O(n+k) 最差情况:T(n) = O(n2) 平均情况: T(n) = O(n+k)
空间复杂度: O(n+k)
稳定
不是比较排序
占用额外内存
代码实现
#include<iostream>
#include<vector>
#include<list>
using namespace std;
#define SIZE 10
int insert(list<int> &bucket, int val) {
list<int>::iterator iter=bucket.begin();
while(iter!=bucket.end() && val>=*iter) iter++;
bucket.insert(iter,val);
return 0;
}
int bucket_sort(vector<int>& nums){
int length = nums.size();
if(length <= 1) return 0;
int min=nums[0], max=min;
for(int i=1; i<length;i++) {
if(min>nums[i]) min=nums[i];
if(max<nums[i]) max=nums[i];
}
int buckets_num = (max-min)/SIZE + 1;
vector<list <int> > buckets(buckets_num);
for(int i=0;i<length;i++) {
insert(buckets[(nums[i]-min)/SIZE], nums[i]);
}
int index=0;
for(int i=0;i<buckets_num;i++){
if(buckets[i].size()){
for(list<int>::iterator iter=buckets[i].begin(); iter!=buckets[i].end(); iter++)
nums[index++]=*iter;
}
}
return 0;
}
int main() {
int b[]={19,56,78,23,54,85,32,12,34,56,76,87,34,2,24,75,53,23,52,62};
vector<int> nums(b,b+20);
int length = nums.size();
for(int i=0;i<length;i++)
cout<<nums[i]<<" ";
cout<<endl;
bucket_sort(nums);
for(int i=0;i<length;i++)
cout<<nums[i]<<" ";
cout<<endl;
return 0;
}