简单计数排序
计数排序(Simple Count Sort),顾名思义,通过统计数量的方式实现排序的一种算法。这里的简单计数排序是指,直接统计全体数据中元素值小于某一数据的个数,根据该个数即确定该元素的排序位置,直接放置该元素。下面是简单计数排序的Java代码:
/**
* 简单计数排序:不可重复数列
* @param data
*/
private static int[] simpleCountSort(int[] data) {
//放置临时数据
int[] temps = new int[data.length];
//统计个数
int count;
for (int i = 0; i < data.length; i++) {
count = 0;
for (int j = 0; j < data.length; j++) {
if (data[j]<data[i]) {
count++;
}
}
//将数据放入指定位置
temps[count] = data[i];
}
return temps;
}
但是上述算法存在一个问题,即只能用来排序非重复的数列,这大大降低了该算法的适用性。下面对上述算法做一下修正:
/**
* 简单计数排序:支持可重复数列
* @param data
*/
private static int[] simpleCountSort2(int[] data) {
//放置临时数据
int[] temps = new int[data.length];
//统计个数
int count;
for (int i = 0; i < data.length; i++) {
count = 0;
for (int j = 0; j < data.length; j++) {
if (data[j]<data[i]) {
count++;
}
}
//将数据放入指定位置
temps[count] = data[i];
}
//因为重复的数会以0补全因此只需考虑其中值为0的元素
for (int i = 1; i < temps.length; i++) {
if (temps[i]==0 && temps[i-1] != 0) {
temps[i] = temps[i-1];
}
}
return temps;
}
支持可重复元素序列虽然实现了,但是我们发现其空间复杂度为O(n),时间复杂度为O(n^2)。付出了O(n)的空间成本,但时间复杂度仍然没有降下来。这是我们所不希望看到的。解决该问题,显然应该换一种思路,一种全新的思路。有幸的是,计数排序就是我们所期望的,同时它也很好的完成了增加空间成本有效降低时间复杂度的任务。
计数排序
生活中,假如我们有一些碎钱,比如有一角、五角、一元、五元、十元不等。如果我们想对他们排序,我们的通常的做法可能是一张张的按大小进行排列(类似于选择排序或插入排序)。但还有种排序方式,即先将一角、五角、一元、五元、十元的相同面值的放在一块,然后按照面值大小进行排序。前面的做法像黎曼积分,后面的做法则类似勒贝格积分。有意思的是,计数排序恰恰就有后者的影子。
计数排序的思想是,数据有界的情况下,将数据等值划分,然后将不同大小的数据分别匹配到这些数据之中。因为只是匹配数据,因此也没有数据交换的出现。之后,累加这些等值划分的数据统计个数,这样依次可获得数据值从低到高的序列数。将各个位数上的数据放入临时的数据集合中,即完成了排序。
下面是对百度百科提供的java代码稍作修改的代码:
/**
* 计数排序
* @param data
* @return
*/
private static int[] countSort(int[] data) {
//设置临时数据
int[] temps = new int[data.length];
//获取最大和最小值
int max = data[0];
int min = data[0];
for (int i : data) {
if (i>max) {
max = i;
}
if (i<min) {
min = i;
}
}
//数据差值区间
int k = max - min + 1;
//需要匹配的元素区间
int[] c = new int[k];
//匹配元素将获得每一个区间中数值含有序列data中元素的个数
for (int j = 0; j < data.length; j++) {
c[data[j] - min] += 1;
}
//将这些匹配的元素累加起来,获得每一个匹配值的顺序数
for (int i = 1; i < c.length; i++) {
c[i] = c[i] + c[i-1];
}
//将每一个数据放置到它对应的顺序位置中
for (int i = data.length -1; i >= 0; i--) {
temps[--c[data[i]-min]] = data[i];
}
return temps;
}