【堆排序思想】找出100万个数据中的前100大数据

生成随机数据存入txt文件中

首先在c++代码的文件下新建一个txt文件,命名为test.txt,然后在generate_random.cpp中写如下代码:

#include<bits/stdc++.h>
const long long N = 1000001;
using namespace std;
long long x[N];

int main(){
	fstream fso("test.txt", ios::out);
	int i;
	for(i = 1; i <= N-1; ++i)
		fso << rand() << ' ';
	fso.close();
	   
	fstream fsi("test.txt", ios::in);

	for(i = 1; i <=N-1; ++i){
		fsi >> x[i];
	}
	
    cout<<"Total:"<<N-1<<endl;;
  	return 0;
}

在这里插入图片描述

寻找出前100大的数据

先读取txt文件中生成的100万个随机数,这个量是很大的(其实可以生成更多,这里用100w为例),如果完整排序后输出前100大,这样非常耗时!所以选择如下算法:
构造一个容量为100的小顶堆,将随机生成数中前100个存进去,然后遍历剩下的N-100个数据,如果比堆顶大,那么和堆顶交换,然后执行一次构造小顶堆的函数(所以选择把构造小顶堆的函数分离出来写);如果这个数不比堆顶大,那么舍弃这个数,也就是接着遍历后面的数…遍历完剩下的数之后,这个小顶堆也就是存储的前100大的数了,直接输出结果即可。

#include<bits/stdc++.h>
const long long N = 1000001;
using namespace std;
long long x[N],tree[101];

void find_largest_100(long long a[],long long tree[]);
void creat_minheap(long long a[]);

int main(){
	int i;
	ifstream in("test.txt");
	for(i=1;i<=N-1;i++){
		in>>x[i];
	}
	in.close();
	for(i=1;i<=100;i++){
		tree[i]=x[i];
	}
	creat_minheap(tree);
	find_largest_100(x,tree);
	
	for(i=1;i<=100;i++){
		cout<<i<<":"<<tree[i]<<"\n";
	}
	return 0;
}
//取前100个数构造小顶堆 
void creat_minheap(long long a[]){
	int n,i,k,t;
	for(i=2;i<=100;i++){
		k=i;
		while(k>0){
			if(k/2<=0||a[k]>=a[k/2]) break;
			else{
				swap(a[k],a[k/2]);
				k/=2;
			}
		}
	}
}
//找前100大的数
void find_largest_100(long long a[],long long tree[]){
	int i;
	for(i=101;i<=N-1;i++){
		if(a[i]<=a[1]) continue;
		swap(a[i],tree[1]);
		creat_minheap(tree);
	}
} 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr.zwX

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值