基数排序
名词解释:基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,将要排序的元素分配至某些“桶”中,藉以达到排序的作用,基数排序法是属于稳定性的排序,其时间复杂度为O (nlog(r)m),其中r为所采取的基数,而m为堆数,在某些时候,基数排序法的效率高于其它的稳定性排序法。
历史渊源:基数排序的发明可以追溯到1887年赫尔曼·何乐礼在打孔卡片制表机(Tabulation Machine)上的贡献。它是这样实现的:将所有待比较数值(正整数)统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。基数排序的方式可以采用LSD(Least significant digital)或MSD(Most significant digital),LSD的排序方式由键值的最右边开始,而MSD则相反,由键值的最左边开始。
排序步骤:
第一步
以LSD为例,假设原来有一串数值如下所示:
73, 22, 93, 43, 55, 14, 28, 65, 39, 81
首先根据个位数的数值,在走访数值时将它们分配至编号0到9的桶子中:
0
1 81
2 22
3 73 93 43
4 14
5 55 65
6
7
8 28
9 39
第二步
接下来将这些桶子中的数值重新串接起来,成为以下的数列:
81, 22, 73, 93, 43, 14, 55, 65, 28, 39
接着再进行一次分配,这次是根据十位数来分配:
0
1 14
2 22 28
3 39
4 43
5 55
6 65
7 73
8 81
9 93
第三步
接下来将这些桶子中的数值重新串接起来,成为以下的数列:
14, 22, 28, 39, 43, 55, 65, 73, 81, 93
这时候整个数列已经排序完毕;如果排序的对象有三位数以上,则持续进行以上的动作直至最高位数为止。
LSD的基数排序适用于位数小的数列,如果位数多的话,使用MSD的效率会比较好。MSD的方式与LSD相反,是由高位数为基底开始进行分配,但在分配之后并不马上合并回一个数组中,而是在每个“桶子”中建立“子桶”,将每个桶子中的数值按照下一数位的值分配到“子桶”中。在进行完最低位数的分配后再合并回单一的数组中。
图解:
算法分析
时间效率 :设待排序列为n个记录,d个关键码,关键码的取值范围为radix,则进行链式基数排序的时间复杂度为O(d(n+radix))
,其中,一趟分配时间复杂度为O(n),一趟收集时间复杂度为O(radix),共进行d趟分配和收集。
空间效率:需要2*radix个指向队列的辅助空间,以及用于静态链表的n个指针故为O(2*radix)
算法实现
int Maxbit(int arr[], int size)
{
int p = 1; int count = 0;
for (int i = 0; i < size; i++)
{
while (arr[i]>p)
{
p *= 10;
count++;
}
}
return count;
}
void bucketsort(int arr[], int num)
{
int max = Maxbit(arr, num);
int i = 0;
int j = 0;
int k = 0;
int index = 1;
int *tmp = new int[num];
int *count = new int[10];
for (i = 0; i < max; i++)
{
for (j = 0;j < 10; j++)
{
count[j] = 0;
}
for (j = 0; j < num; j++)
{
k = (arr[j] / index) % 10;
count[k]++;
}
for (j = 1; j < 10; j++)
{
count[j] = count[j - 1] + count[j];
}
for (j = num - 1; j >= 0; j--)
{
k = (arr[j] / index) % 10;
tmp[count[k] - 1] = arr[j];
count[k]--;
}
index *= 10;
for (j = 0; j < num; j++)
{
arr[j] = tmp[j];
}
}
delete[] tmp;
delete[] count;
}
int main()
{
int array[] = {1,3,6,2,5,8,7,9,4,6,12,30,300};
const int num = sizeof(array) / sizeof(array[0]);
bucketsort(array,num);
for (int i = 0; i <sizeof(array) / sizeof(array[0]); i++)
{
cout << array[i] << " ";
}
return 0;
}