比较简单吧
方法 1 快排取前k个
方法2 不快排,递归求partion,时间 复杂度O(n)吧
#include "stdio.h"
int Partion(int *data,int s,int e)
{
int key =data[e];
int i=s-1;
int j;
int temp;
for(j=s;j<e;j++)
{
if(data[j]<key)
{
temp = data[i+1];
data[i+1]=data[j];
data[j]=temp;
i+=1;
}
}
temp =data[i+1];
data[i+1]=key;
data[e]=temp;
return i+1;
}
void quickSort(int *data,int s,int e,int k)
{
int p;
int len;
if(s<e)
{
p =Partion(data,s,e);
len = p-s+1;
if(len == k)
return;
else if(len<k)
{
quickSort(data,p+1,e,k-len);
}
else
{
quickSort(data,s,p-1,k);
}
}
}
int main()
{
int data[]={4,5,1,6,2,7,3,8};
int len =sizeof(data)/sizeof(data[0]);
int k;
int i=0;
scanf("%d",&k);
quickSort(data,0,len-1,k);
for(i=0;i<k;i++)
printf("%d ",data[i]);
}
看海涛书上面 有一个o(nlogK)的方法,这个方法适合与海量数据搜索
很经典了。
利用一个容器,存储k个元素,同时记录其最大元素,如果插入元素大于它,则删除容器一个元素,插入它,否则继续。
这样就可以保住容器里面始终都是最小的k个元素,当然有n个元素 ,当然时间复杂度为o(nlogk)
搞了好一阵子,采用multiset搞了一个版本出来,不过话说 c++的stl库真心好用啊,编程遇到这种问题估计使用stl实现,速度会快很多的
代码如下
#include <set>
#include <iostream>
using namespace std;
struct cmp{
bool operator()(const int &a,const int &b)const
{
return a>b;
}
};
void getListK(int *data,int start,int len,int k,multiset<int,cmp> &mySet)
{
int i=start;
mySet.clear();
for(i=start;i<len;i++)
{
if (mySet.size()<k)
{
mySet.insert(data[i]);
}
else
{
multiset<int,cmp>::iterator iter=mySet.begin();
if(data[i]<*(mySet.begin()))
{
mySet.erase(iter);
mySet.insert(data[i]);
}
}
}
}
int main()
{
int data[]={4,5,1,6,2,7,3,8};
int k;
int len = sizeof(data)/sizeof(data[0]);
scanf("%d",&k);
multiset<int,cmp> mySet;
getListK(data,0,len,k,mySet);
multiset<int,cmp>::iterator iter;
for(iter=mySet.begin();iter != mySet.end();iter++)
cout<<*iter<<' ';
return 0;
}
据说multiset是使用红黑树实现的插入和删除都是logk的复杂度,同时我定义最大元素在最前面,这样直接取第一个元素就行咯。
好方法,多总结。
multiset可以运行容器包含相同元素
而set则不可以