<strong>2014.6.18</strong>
题目描述:
查找最小的k个元素
题目:输入n个整数,输出其中最小的k个。
例如输入1,2,3,4,5,6,7和8这8个数字,则最小的4个数字为1,2,3和4。
方法:
方案一:快排,选出前k个数,时间复杂度O(nlogn)
方案二:选出前k个数的最大值,然后取后边的元素与之对比,如果比kmax大或相等,跳过继续,否则,更换kmax,选出kmax',继续,直到最后,时间复杂度O(nk)。
方案三:方案二的优化,在选择kmax时使用构建最大堆,每次用要比较的元素与堆顶元素进行比较替换,重新构建堆,时间复杂度O(nlogk)。
#include<iostream>
#include<assert.h>
using namespace std;
void MaxHeap(int heap[],int i,int len);
void BuildHeap(int heap[],int len)
{
if(heap == NULL)
return ;
int index = len / 2;
for(int i=index;i>=1;i--)
{
MaxHeap(heap,i,len);
}
}
void MaxHeap(int heap[],int i,int len)
{
int largeIndex = -1;
int left = 2 * i;
int right = 2 * i + 1;
if(left<=len && heap[i]<heap[left])
{
largeIndex = left;
}
else
{
largeIndex = i;
}
if(right<=len && heap[largeIndex] < heap[right])
{
largeIndex = right;
}
if(largeIndex != i)
{
swap(heap[largeIndex],heap[i]);
MaxHeap(heap,largeIndex,len);
}
}
int main()
{
int k;
cin>>k;
int *heap=new int[k+1];
FILE *fp = fopen("C:/Users/Administrator/Documents/Visual Studio 2008/Projects/test/data.txt","r");
assert(fp);
for(int i=1;i<=k;i++)
{
fscanf(fp,"%d",&heap[i]);
}
BuildHeap(heap,k);
int newData;
while(fscanf(fp,"%d",&newData)!=EOF)
{
if(newData < heap[1])
{
heap[1] = newData;
MaxHeap(heap,1,k);
}
}
for(int j=1;j<=k;j++)
{
cout<<heap[j]<<" ";
}
cout<<endl;
fclose(fp);
return 0;
}
方案四:编程之美的一个解法,使用快速选择算法,即先选择一个枢纽元,然后进行划分,分成两个部分s1和s2,s1<=key<=s2,如果|s1|==k或|s1|+1==k,则找到,如果|s1|+1<k,则在s2中找到剩下的k-|s1|-1个元素。然后递归调用,最坏的时间复杂度是O(n^2),平均时间复杂度O(n)。
在选择枢纽元时,可随机选取(具体方法。。。。)。
三数中值法
int partition(int array[],int left,int right)
{
int pivot = array[right];
int storeIndex = left;
for(int i = left;i<right;i++)
{
if(array[i]<pivot)
{
swap(array[i],array[storeIndex]);
storeIndex ++;
}
}
swap(array[right],array[storeIndex]);
return storeIndex;
}
bool median_select(int array[],int left, int right, int k)
{
if(k-1>right || k+1 < left)
return false;
int midIndex = (left+right) / 2;
if(array[left]<array[midIndex])
swap(array[left],array[midIndex]);
if(array[midIndex] > array[right])
swap(array[right],array[midIndex]);
if(array[left]<array[right])
swap(array[left],array[right]);
int pos = partition(array,left,right);
if(pos == k-1)
return true;
else if(pos > k-1)
return median_select(array,left,pos-1,k);
else return median_select(array,pos+1,right,k);
}
随机选取法
int my_rand(int low,int high)
{
int size = high - low +1;
return low + rand()%size;
}
bool rand_select(int array[], int left, int right, int k)
{
//第k小元素,实际上应该在数组中下标为k-1
if (k-1 > right || k-1 < left)
return false;
//随机从数组中选取枢纽元元素
int Index = my_rand(left, right);
swap(array[Index], array[right]);
int pos = partition(array, left, right);
if (pos == k-1)
return true;
else if (pos > k-1)
return rand_select(array, left, pos-1, k);
else return rand_select(array, pos+1, right, k);
}
相似题目:
1、谷歌面试题:输入是两个整数数组,他们任意两个数的和又可以组成一个数组,求这个和中前k个数怎么做?
分析:
“假设两个整数数组为A和B,各有N个元素,任意两个数的和组成的数组C有N^2个元素。
那么可以把这些和看成N个有序数列:
A[1]+B[1] <= A[1]+B[2] <= A[1]+B[3] <=…
A[2]+B[1] <= A[2]+B[2] <= A[2]+B[3] <=…
…
A[N]+B[1] <= A[N]+B[2] <= A[N]+B[3] <=…
问题转变成,在这N^2个有序数列里,找到前k小的元素”
2、有两个序列A和B,A=(a1,a2,...,ak),B=(b1,b2,...,bk),A和B都按升序排列。对于1<=i,j<=k,求k个最小的(ai+bj)。要求算法尽量高效。
3、给定一个数列a1,a2,a3,...,an和m个三元组表示的查询,对于每个查询(i,j,k),输出ai,ai+1,...,aj的升序排列中第k个数。