《Algorithms Unlocked》读书笔记3——计数排序
《Algorithms Unlocked》是 《算法导论》的合著者之一 Thomas H. Cormen 写的一本算法基础,算是啃CLRS前的开胃菜和辅助教材。如果CLRS的厚度让人望而生畏,这本200多页的小读本刚好合适带你入门。
书中没有涉及编程语言,直接用文字描述算法,我用 JavaScript 对书中的算法进行描述。
超越下界
之前的四个排序算法——选择排序、插入排序、归并排序、快速排序都是依赖于对排序关键字进行的比较。他们的决策依据都是“如果这个元素的排序关键字比另一个元素的排序关键字小,那么就进行相应操作,否则,进行其他操作或者什么也不做。”假如我们还是依赖这一规则,无论是简单或复杂的算法或者还没被发现的算法都无法突破这一下界(最坏情况下所需要的最小时间)。所以我们需要更改游戏规则,不让算法利用比较来进行排序。
计数排序
假设我们有一个数组,该数组内的元素都是 0~m-1 范围内的整数。例如 let array = [4, 1, 5, 0, 1, 6, 5, 1, 5, 3]
。如果我们可以知道排序关键字为 5 的元素有三个,并且刚好有 6 个元素的排序关键字小于 5,那么三个 5 应该位于位置6、7、8上。
首先我们要计算出有多少个元素的排序关键字等于某个值。比如有 3 个元素的排序关键字等于 5。
// m:定义了数组array中元素的取值范围 0~m-1
function countKeysEqual(array, m) {
// 创建一个空数组,长度为m,给每个元素赋值0
// 为什么要有这一步,万一哪个值array里没有就会变成NaN
let equal = [];
for (let i = 0; i < m; i++) {
equal[i] = 0;
};
for (let j = 0; j < array.length; j++) {
// 把array中的元素作为equal数组的索引值
// 该索引值在equal中对应的值为该元素在array中出现的次数
let key = array[j];
equal[key] += 1;
}
return equal;
}
接着我们计算出有多少个元素的排序关键字小于该值。比如有 6 个元素的排序关键字小于 5.
// equal 为上个函数返回的数组
function countKeysLess(equal, m) {
let less = [];
less[0] = 0;
for (let i = 1; i < m; i++) {
// less[i] = equal[0] + equal[1] + ... + equal[i - 1]
less[i] = less[i - 1] + equal[i - 1];
}
return less;
}
一旦得到less数组,我们就可以知道每个元素应该放在哪个位置。
// 根据less可以得知元素在数组中的位置
// 重排数组
function rearrange(array, less, m) {
let arrB = [];
for (let i = 0; i < array.length; i++) {
let key = array[i];
// 有几个小于key的元素排在key前面,则为key值在arrB中的索引
// 比如数组[0, 1, 1, 2],有3个排序关键字小于2,则2的索引为3
let index = less[key];
arrB[index] = array[i];
// 自增1,相同值的元素排在该值后一位
less[key] += 1;
}
return arrB;
}
把三个函数组合在一起构成计数排序。
// m:定义了数组array中元素的取值范围 0~m-1
function countSort(array, m) {
let equal = countKeysEqual(array, m);
let less = countKeysLess(equal, m);
let arrB = rearrange(array, less, m);
return arrB;
}
计数排序能够超越比较排序的下界,因为它从来不会对排序关键字进行比较。反之,它将排序关键字作为数组的索引,能进行这样的操作是因为排序关键字均是非常小的整数。如果排序关键字是带有分数的实数,或者是字符串,那么我们就不能使用计数排序了。