这次与大家一起讨论的问题是在面试题中经常出现的一个。
问题描述:给定一个线性序列,让你用O(n)的时间复杂度找到第k小元素(1 <= k <= n)。
看到这一题的第一印象就是排序,然后遍历找到第k小元素,可是题目要求是用O(n)的时间复杂度。当k = 1时就是找最小元素;当k = n时,就是找最大元素;很显然在时间复杂度为O(n)的时间内都能完成。
对于一般的选择问题,似乎在O(n)的时间为很难完成。但实际上,从渐进阶的意义上看,和上面两种情况都是一样。在O(n)的时间内也能得到解决。
算法思想:该算法实际上是模仿快速排序算法设计出来的;就是对序列进行递归划分。与快速排序算法不同的就是它只对划分出的子数组之一进行递归处理。算法可描述如下:
#include <iostream>
#include <cstdlib>
#include <ctime>
using namespace std;
/*
函数名称:RandomPartition
函数功能:将小于x的元素放在数组的左半部分 大于x的元素放在数组的右半部
函数参数:
a:数组
p:数组的开始位置指针
r:数组的结束位置指针
*/
template <class T>
int RandomPartition(T a[], int p, int r)
{
int x = a[rand()%(r - p + 1)];
int i = p;
int j = r + 1;
while(true)
{
while(a[++i] < x && i < r);
while(a[--j] > x);
if(i >= j) break;
swap(a[i], a[j]);
}
return j;
}
template <class T>
T RandomSelect(T a[], int p, int r, int k)
{
if(p == r) return a[p];
int i = RandomPartition(a, p, r);
int j = i - p + 1;
if(k <= j) return RandomSelect(a, p, i, k);
else return RandomSelect(a, i+1, r, k-j);
}
int main()
{
int a[10] = {3,5,19,56,43,9,10,123,17,198};
cout << RandomSelect(a, 0, 9, 4) << endl;
return 0;
}
在算法RandomSelect中执行RandomPartition后,数组a[p:r]被划分两个子数组a[p:i]和a[i+1:r],使a[p:i]中的每个元素都不大于a[i+1:r]中的每个元素。接下来算法计算子数组a[p:i]中元素的个数j。如果k <= j,则第k小元素落在子数组a[p:i]中;反之,落在子数组a[i+1:r]中。由于此时已知道子数组a[p:i]中元素均小于要找的第k小元素,所以要找的第k小元素就在子数组a[i+1:r]中的第k-j小元素。