生成随机数据存入txt文件中
首先在c++代码的文件下新建一个txt文件,命名为test.txt
,然后在generate_random.cpp
中写如下代码:
#include<bits/stdc++.h>
const long long N = 1000001;
using namespace std;
long long x[N];
int main(){
fstream fso("test.txt", ios::out);
int i;
for(i = 1; i <= N-1; ++i)
fso << rand() << ' ';
fso.close();
fstream fsi("test.txt", ios::in);
for(i = 1; i <=N-1; ++i){
fsi >> x[i];
}
cout<<"Total:"<<N-1<<endl;;
return 0;
}
寻找出前100大的数据
先读取txt文件中生成的100万个随机数,这个量是很大的(其实可以生成更多,这里用100w为例),如果完整排序后输出前100大,这样非常耗时!所以选择如下算法:
构造一个容量为100的小顶堆,将随机生成数中前100个存进去,然后遍历剩下的N-100个数据,如果比堆顶大,那么和堆顶交换,然后执行一次构造小顶堆的函数(所以选择把构造小顶堆的函数分离出来写);如果这个数不比堆顶大,那么舍弃这个数,也就是接着遍历后面的数…遍历完剩下的数之后,这个小顶堆也就是存储的前100大的数了,直接输出结果即可。
#include<bits/stdc++.h>
const long long N = 1000001;
using namespace std;
long long x[N],tree[101];
void find_largest_100(long long a[],long long tree[]);
void creat_minheap(long long a[]);
int main(){
int i;
ifstream in("test.txt");
for(i=1;i<=N-1;i++){
in>>x[i];
}
in.close();
for(i=1;i<=100;i++){
tree[i]=x[i];
}
creat_minheap(tree);
find_largest_100(x,tree);
for(i=1;i<=100;i++){
cout<<i<<":"<<tree[i]<<"\n";
}
return 0;
}
//取前100个数构造小顶堆
void creat_minheap(long long a[]){
int n,i,k,t;
for(i=2;i<=100;i++){
k=i;
while(k>0){
if(k/2<=0||a[k]>=a[k/2]) break;
else{
swap(a[k],a[k/2]);
k/=2;
}
}
}
}
//找前100大的数
void find_largest_100(long long a[],long long tree[]){
int i;
for(i=101;i<=N-1;i++){
if(a[i]<=a[1]) continue;
swap(a[i],tree[1]);
creat_minheap(tree);
}
}