基数排序(Radix sort)是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序也不是只能使用于整数。基数排序的发明可以追溯到1887年赫尔曼·何乐礼在打孔卡片制表机(Tabulation Machine)上的贡献[1]。
它是这样实现的: 将所有待比较数值(正整数)统一为同样的数位长度,数位较短的数前面补零. 然后, 从最低位开始, 依次进行一次排序.这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列.
基数排序的方式可以采用LSD(Least significant digital)或MSD(Most significant digital),LSD的排序方式由键值的最右边开始,而MSD则相反,由键值的最左边开始。
效率
基数排序的时间复杂度是 O(k·n),其中n是排序元素个数,k是数字位数。注意这不是说这个时间复杂度一定优于O(n·log(n)),因为k的大小一般会受到 n 的影响。 以排序n个不同整数来举例,假定这些整数以B为底,这样每位数都有B个不同的数字,k就一定不小于logB(n)。由于有B个不同的数字,所以就需要B个不同的桶,在每一轮比较的时候都需要平均n·log2(B) 次比较来把整数放到合适的桶中去,所以就有:
- k 大于或等于 logB(n)
- 每一轮(平均)需要 n·log2(B) 次比较
所以,基数排序的平均时间T就是:
- T ≥ log B( n)· n·log 2( B) = log 2( n)·log B( 2)· n·log 2( B) = log 2(n)·n·log B(2)·log 2( B) = n·log 2( n)
所以和比较排序相似,基数排序需要的比较次数:T ≥ n·log2(n)。 故其时间复杂度为 Ω(n·log2(n)) = Ω(n·log n) 。
/*
分配排序的基本思想:
排序过程无须比较关键字,而是通过“分配”和“收集”过程来实现排序。
它们的时间复杂度可达到线性阶:O(n)。
*/
#include <iostream>
#include <queue>
using namespace std;
#define radix 10
/*
最次位优先法(LSD法)。
先按kd排序,将序列分成若干子序列,每个子序列中的记录具有相同的kd值;
再按kd-1排序,将每个子序列分成更小的子序列
;然后,对后面的关键码继续同样的排序分成更小的子序列,直到按k1排序分组分成最小的子序列后,
最后将各个子序列连接起来,便可得到一个有序的序列。
前面介绍的扑克牌先按面值再按花色进行排序的方法就是LSD法
*/
void radixSort(int A[],int len)
{
queue<int> list[radix];
int i=1,j=0;
int max = A[0];
int base;
while (i<len)
{
if(max<A[i]) max=A[i];
i++;
}
//cout<<"max: "<<max<<endl;
int size=0;
while(max>0)
{
max=max/10;
size++;
}
int t=1;
while(size>0)
{
//cout<<"size: "<<size<<endl;
//------------分配过程--------------------------
for(i=0;i<len;i++)
{
base=(A[i]/t)%10;
list[base].push(A[i]);
}
t = t*10;
size--;
//------------收集过程---------------------------
j=0;
for(i=0;i<radix;i++)
{
while(!list[i].empty())
{
A[j]=list[i].front();
//cout<<A[j]<<" ";
list[i].pop();
j++;
}
}
//cout<<endl;
}
}
int main()
{
//int A[]={15,9,8,1,4,11,7,12,13,16,5,3,6,2,10,14};
int A[]={13,14,94,33,82,25,59,94,65,23,45,27,73,25,39,10,35,54,90,58};
int i;
int len=sizeof(A)/sizeof(int); //在这里 sizeof(array)=80
radixSort(A,len);
for(i=0;i<len;i++)
{
cout<<A[i]<<" ";
}
cout<<endl;
return 0;
}