一、前情回顾
前面讲述了多种排序算法(冒泡,插入,快速排序,归并排序,堆排序),其中最慢的时间复杂度为,最快的时间复杂度为,上述五种排序算法均是通过数据与数据之间的比较进行的,可以得出,若排序算法是通过比较进行的,那么它最快的时间复杂度为。
与此同时,可以采用线性的方法,将数据进行排序(非比较排序)。
二、计数排序
计数排序很好理解,运用哈希的方法,将每个数据出现的次数都统计下来。哈希表是顺序的,所以我们统计完后直接遍历哈希表,将数据再重写回原数据空间就可以完成排序。
计数排序算法实现过程
1.对于一个数组,运用数组sum记录每个数据出现的次数
2.再根据sum数组记录的数据,依次输出相应个数的元素即可
1 2 2 3 4 4 4 5 5
计数排序简单易懂,并且时间复杂度为线性的O(n+m) (n为数据个数,m为数据范围)
对于时间复杂度O(n+m)的理解:因为计数排序首先对M (数据范围)循环,依次判断每个数据对应的元素个数,将其放入新数组(已排序数组),共有N 个元素,因此,计数排序的时间复杂度为O(n+m)。
计数排序的局限性:计数排序涉及元素的数据大小(数组需要能够存储足够大的数据),然而当元素数据非常大时(8、9、10位数),计数排序将无法运行,可以通过基数排序对其进行排序。
代码实现:
#include<stdio.h>
#include<iostream>
#include<time.h>
#include<stdlib.h>
int n,m,a[2000001],b[2000001];
int main()
{
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++)
scanf("%d",&a[i]);
for(int i=1;i<=n;i++) b[a[i]]++;
for(int i=1;i<=m;i++)
for(int j=1;j<=b[i];j++)
{
printf("%d ",i);
}
printf("\n");
return 0;
}
三、基数排序
基数排序的原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。(既可以从高位到低位依次比较,也可以从低位到高位比较)
这里以从低位到高位(三位数)比较为例:
算法思路过程:
对于实现代码的注意点:
1.(按位分割)求出每个数的各个位上的数:
digit为10^n。
例如:求各个位上的数 (以372为例)
求个位: 372/(10^0) %10 = 2
求十位: 372/(10^1) % 10 = 7
求百位: 372/(10^2) % 10 = 3
2. 需要建立一个二维数组 SUM[10][maxm]
SUM[x][i] 表示 某个 位数为X 的 第i个数
基数排序就可以很好的解决计数排序存在的问题,解决了数据范围较大时的排序。
对基数排序算法时间复杂度的分析:
因为需要对元素数据进行拆分,拆分成X位数,共进行n次拆分更新数组,因此时间复杂度为O(XN) 其中N为元素个数,X为最大数是X位数,通常X不超过10,可以将基数排序看成一个线性的排序方法。
代码实现:
#include<stdio.h>
#include<string.h>
#include<iostream>
#include<math.h>
using namespace std;
int n,a[10001],b[10001],x,s[10][10001],sum[10],maxn;
void radixsort(int x)
{
if(x>maxn) return;
for(int i=1;i<=n;i++)
{
b[i]=(a[i]/x)%10;
sum[b[i]]++;
s[b[i]][sum[b[i]]]=a[i];
}
int nx=0;
for(int i=0;i<=9;i++)
for(int j=1;j<=sum[i];j++)
a[++nx]=s[i][j];
for(int i=0;i<=9;i++)
for(int j=1;j<=sum[i];j++)
s[i][j]=0;
for(int i=0;i<=9;i++) sum[i]=0;
x=x*10;
radixsort(x);
}
int main()
{
scanf("%d",&n);
for(int i=1;i<=n;i++)
{
scanf("%d",&a[i]);
maxn=max(maxn,a[i]);
}
radixsort(1);
for(int i=1;i<=n;i++) printf("%d ",a[i]);
return 0;
}