一个好的算法往往是在朴素的想法上进行加工改造,我们要求数组中的第k大元素,往往最先想到的想法是先进行降序排序,可以很快的达到答案。但排序在序列元素很多时,无疑是一个浩大的工程。要至少耗费O(logn)的时间复杂度,如果想在线性时间O(n)就想做到求解应该怎么做呢?
我们先思考排序为什么可以解决该问题:
如果我们随便选定一个元素,假想的认为它就是我们要找的第k大元素,我们最终要考察,证明的是这个元素在序列降序排序后到底应该处于哪个位置,如果是在第k位,那自然就是第k大元素。说到这里似乎漏出了点端倪,是啊,我们这样证明的话并不需要将序列完整的排序,我们只需要将比这个选定元素小的元素排在他的前面,比他大的开到后面去,这时他是不是第k大的元素同样一目了然。
这样子搞,运气好了,选的元素正好就是第k大的,那贼舒服,美滋滋。
但人生不如意事十之八九,如果有这个运气,似乎买彩票都能中奖了。
别慌,虽然我们可能一下子猜不对,但是我们每次猜测都是对历史进程有帮助的!
假如我们有乱序序列 5 8 3 2 1,我们想求它的第3大元素,我们最开始随便一猜,认定5就是第k大元素,这个时候我们把比5大的放到5的左边,比比5小的放到5的右边
序列变成了 8 5 3 2 1.
额,第一次没猜中,不过真的不遗憾,我们猜的5,最终位置是2,比3要小,我们至少可以判断第3大元素肯定不在2及的左边
我们考察的范围可以缩小至近乎原来的一半。我们只需要考察3 2 1即可,接下来,我们猜的是3,比他大的放到左边,比他小的放到右边,序列没变!仍然是 8 5 3 2 1 。这时,我们确定了3就是我们猜的第3大元素,进行输出
for(int lo=0 , hi = n-1; lo<hi;){
int i = lo, j = hi; int pivot = a[lo];
//在区间[lo,hi)里,比p小的放到p后面,比p大的放在前面
while( i < j){
while( i < j && a[j] <=pivot )j--;a[i] = a[j];//右边小于pivot的都跳过,大于的提到前面去
while( i < j && a[i] >= pivot)i++;a[j] = a[i];//左边大于pivot的都跳过,小于的提到后面去
}
a[i] = pivot;//撞车的部分不是i发现不对劲就是j发现了不对劲,元素已经被转移了
if( i == k){cout<<a[k-1];return 0;}//k-1是因为下标是从0开始的
else if( k > i)lo = i + 1;
else if( k < i)hi = i - 1;
}