快速排序虽然总体的平均效率是最好的,但也不是在任何时候都是最优的算法。比如数组本身已经是排好序了,而每一轮排序的时候都是以最后一个数字作为比较的标准,此时快速排序的效率只有 O(n2) 。因此在这种场合快速排序就不是最优的选择。
考虑如下的场景,如何以时间效率 O(n) 实现对公司员工年龄的排序,公司共有几万名员工。
其实公司员工的年龄只在一个很小的区间内变化(range),又因为有那么多的员工存在,也即会有大量的员工年龄存在重复。由此我们可以建立一张表,维护年龄和出现次数的关系。
void SortAges(int ages[], int len)
{
if (ages == NULL || len <= 0)
return;
const int oldest = 99;
int cnt[oldest] = {0};
for (int i = 0; i < len; ++i)
++cnt[ages[i]];
// 统计计数完毕
int idx = 0;
for (int i = 0; i < oldest; ++)
for (int j = 0; j < cnt[i]; ++j)
// i:表示年龄,且从小到大
// cnt[i]:表示该年龄出现的次数
// ∑cnt[i] = len
ages[idx++] = i;
// 不排序而排序
}
客户端调用:
#include <iostream>
#include <algorithm>
#include <iterator>
using namespace std;
int randint(int s, int e)
{
return rand() % (e - s) + s;
}
int main(int, char**)
{
const int N = 10000;
int ages[N];
for (int i = 0; i < N; ++i)
ages[i] = randint(20, 100);
SortAges(ages, N);
copy(ages, ages + N, ostream_iterator<int>(cout, " "));
cout << endl;
return 0;
}
注:时间效率为 O(n) 一般意味着一次遍历,或稍微复杂的情况。