以下代码的功能是:输入数据规模n和排序规模k。算法随机生成n个数,并且将最大的k个数存储到vector中。并且输出排序耗时。
TopK排序使用堆排序实现。维护一个小顶堆,每次读入一个数据,将之与堆顶数据进行比较。如果新读入的数据更大,则替换堆顶,然后重新将堆维护为小顶堆。全部数据处理完毕后,堆内存储的数据即为全部n个数中最大的k个。堆顶元素即为全部n个数中第k大的。
为了编程简便,以下代码采用STL优先队列实现堆排序。
#include <bits/stdc++.h>
#define SIZE 999000000
using namespace std;
void display(vector <int> &a,int n) {
int i;
for(i=0; i<n-1; i++)
cout<<a[i]<<" ";
cout<<a[i]<<endl;
}
void TopKSort(vector <int> &nums,int n,int k) {//优先队列实现堆排序
priority_queue<int, vector<int>, greater<int> > q;
for(int i=0; i<n; i++) {
if(q.size()<k)
q.push(nums[i]);
else if(q.top()<nums[i]) {
q.pop();
q.push(nums[i]);
}
}
vector<int> ans;
while(!q.empty()) {
ans.push_back(q.top());
q.pop();
}
}
int main() {
clock_t c_start,c_end;
double t=0;
vector <int> original_data(SIZE);
vector <int> a(SIZE);
int i,n,k;
cin>>n>>k;//输入数据规模 和top K规模
srand((unsigned)time(NULL));//srand()函数产生一个以当前时间开始的随机种子
for(i=0; i<n; i++)//拷贝一份数据用来排序。保持原随机数据不变。
a[i]=original_data[i];
c_start=clock();
TopKSort(a,n,k);
c_end=clock();
t+=(double)(c_end-c_start)/CLOCKS_PER_SEC;//保存本次排序耗时 用t+=ti的方式计算时间,方便以后改成排序n次取平均时间
cout<<t<<endl;
}