基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,将要排序的元素分配至某些“桶”中,藉以达到排序的作用,基数排序法是属于稳定性的排序,其时间复杂度为O (nlog(r)m),其中r为所采取的基数,而m为堆数,在某些时候,基数排序法的效率高于其它的稳定性排序法。
第一步
以LSD为例,假设原来有一串数值如下所示:
73, 22, 93, 43, 55, 14, 28, 65, 39, 81
首先根据个位数的数值,在走访数值时将它们分配至编号0到9的桶子中:
0
1 81
2 22
3 73 93 43
4 14
5 55 65
6
7
8 28
9 39
第二步
接下来将这些桶子中的数值重新串接起来,成为以下的数列:
81, 22, 73, 93, 43, 14, 55, 65, 28, 39
接着再进行一次分配,这次是根据十位数来分配:
0
1 14
2 22 28
3 39
4 43
5 55
6 65
7 73
8 81
9 93
第三步
接下来将这些桶子中的数值重新串接起来,成为以下的数列:
14, 22, 28, 39, 43, 55, 65, 73, 81, 93
这时候整个数列已经排序完毕;如果排序的对象有三位数以上,则持续进行以上的动作直至最高位数为止。
LSD的基数排序适用于位数小的数列,如果位数多的话,使用MSD的效率会比较好。MSD的方式与LSD相反,是由高位数为基底开始进行分配,但在分配之后并不马上合并回一个数组中,而是在每个“桶子”中建立“子桶”,将每个桶子中的数值按照下一数位的值分配到“子桶”中。在进行完最低位数的分配后再合并回单一的数组中。
时间复杂度:
设待排序列为n个记录,d个关键码,关键码的取值范围为radix,则进行链式基数排序的时间复杂度为O(d(n+radix)),其中,一趟分配时间复杂度为O(n),一趟收集时间复杂度为O(radix),共进行d趟分配和收集。 空间效率:需要2*radix个指向队列的辅助空间,以及用于静态链表的n个指针。
python实现方法:
import random
def inputarr(data,size):
for i in range(size):
data[i]=random.randint(0,999) #设置 data 值最大为 3 位数
def showdata(data,size):
for i in range(size):
print('%5d' %data[i],end='')
print()
def radix(data,size):
n=1 #n为基数,从个位数开始排序
while n<=100:
tmp=[[0]*100 for row in range(10)] # 设置暂存数组,[0~9位数][数据个数],所有内容均为0
for i in range(size): # 对比所有数据
m=(data[i]//n)%10 # m为 n 位数的值,如 36 取十位数(36/10)%10=3
tmp[m][i]=data[i] # 把 data[i] 的值暂存在 tmp 中
k=0
for i in range(10):
for j in range(size):
if tmp[i][j] != 0: # 因为一开始设置 tmp ={0},故不为 0 者即为
data[k]=tmp[i][j] # data 暂存在 tmp 中的值,把 tmp 中的值放
k+=1 # 回 data[ ]里
print('经过%3d位数排序后:' %n,end='')
showdata(data,size)
n=10*n
data=[0]*100
size=int(input('请输入数列的大小(100以下):'))
print('您输入的原始数据是:')
inputarr (data,size)
showdata (data,size)
radix (data,size)
输出:
请输入数列的大小(100以下):11
您输入的原始数据是:
372 82 45 931 982 171 74 587 1 724 287
经过 1位数排序后: 931 171 1 372 82 982 74 724 45 587 287
经过 10位数排序后: 1 724 931 45 171 372 74 82 982 587 287
经过100位数排序后: 1 45 74 82 171 287 372 587 724 931 982