【堆排序思想】找出100万个数据中的前100大数据

最新推荐文章于 2024-09-10 21:11:39 发布

Mr.zwX

最新推荐文章于 2024-09-10 21:11:39 发布

阅读量2.2k

点赞数

分类专栏：【算法竞赛】树模型

本文链接：https://blog.csdn.net/qq_16763983/article/details/105565914

版权

【算法竞赛】树模型专栏收录该内容

6 篇文章 0 订阅

订阅专栏

生成随机数据存入txt文件中

首先在c++代码的文件下新建一个txt文件，命名为test.txt，然后在generate_random.cpp中写如下代码：

#include<bits/stdc++.h>
const long long N = 1000001;
using namespace std;
long long x[N];

int main(){
	fstream fso("test.txt", ios::out);
	int i;
	for(i = 1; i <= N-1; ++i)
		fso << rand() << ' ';
	fso.close();
	   
	fstream fsi("test.txt", ios::in);

	for(i = 1; i <=N-1; ++i){
		fsi >> x[i];
	}
	
    cout<<"Total:"<<N-1<<endl;;
  	return 0;
}

在这里插入图片描述

寻找出前100大的数据

先读取txt文件中生成的100万个随机数，这个量是很大的（其实可以生成更多，这里用100w为例），如果完整排序后输出前100大，这样非常耗时！所以选择如下算法：
构造一个容量为100的小顶堆，将随机生成数中前100个存进去，然后遍历剩下的N-100个数据，如果比堆顶大，那么和堆顶交换，然后执行一次构造小顶堆的函数（所以选择把构造小顶堆的函数分离出来写）；如果这个数不比堆顶大，那么舍弃这个数，也就是接着遍历后面的数…遍历完剩下的数之后，这个小顶堆也就是存储的前100大的数了，直接输出结果即可。

#include<bits/stdc++.h>
const long long N = 1000001;
using namespace std;
long long x[N],tree[101];

void find_largest_100(long long a[],long long tree[]);
void creat_minheap(long long a[]);

int main(){
	int i;
	ifstream in("test.txt");
	for(i=1;i<=N-1;i++){
		in>>x[i];
	}
	in.close();
	for(i=1;i<=100;i++){
		tree[i]=x[i];
	}
	creat_minheap(tree);
	find_largest_100(x,tree);
	
	for(i=1;i<=100;i++){
		cout<<i<<":"<<tree[i]<<"\n";
	}
	return 0;
}
//取前100个数构造小顶堆 
void creat_minheap(long long a[]){
	int n,i,k,t;
	for(i=2;i<=100;i++){
		k=i;
		while(k>0){
			if(k/2<=0||a[k]>=a[k/2]) break;
			else{
				swap(a[k],a[k/2]);
				k/=2;
			}
		}
	}
}
//找前100大的数
void find_largest_100(long long a[],long long tree[]){
	int i;
	for(i=101;i<=N-1;i++){
		if(a[i]<=a[1]) continue;
		swap(a[i],tree[1]);
		creat_minheap(tree);
	}
}