取一个文件中最大的k个值(运行内存有限)

最新推荐文章于 2024-09-28 22:05:59 发布

GanGuaGua

最新推荐文章于 2024-09-28 22:05:59 发布

阅读量214

点赞数 2

文章标签：算法

本文链接：https://blog.csdn.net/Visual_progress/article/details/142356367

版权

我们只能利用10kb的运行空间去取一个有上万个数据甚至上亿个数据的文件时

如果使用冒泡排序和堆排序会很难实现

这时我们可以开辟一个大小为k的数组将文件开头的数据放入数组中将数据转化成小堆所以数组第一个数据就是它所有数据中最小的数据再将文件后面的数据和数据比较如果比数据第一个数据大那么将这个数据移到数组第一个位置中再变成小堆再进行比较再变小堆一直持续到文件数据被遍历完这时数组中的数据就是文件中最大的k个数

整体代码如下

#include<stdio.h>
#include<stdlib.h>
#include<time.h>
void heapdown(int* hp, int site ,int num)
{
	int parent = site;
	int child = parent * 2 + 1;
	while (child < num)
	{
		if (hp[child+1]>0 && hp[child]>hp[child + 1])
		{
			child++;
		}
		if (hp[parent]>hp[child])
		{
			int tmp = hp[parent];
			hp[parent] = hp[child];
			hp[child] = tmp;
		}
		else
		{
			break;
		}
		parent = child;
		child = parent * 2 + 1;
	}
}
//void heapsort(int* hp, int total)
//{
//	for (int i = (total - 1 - 1) / 2; i >= 0; i--)
//	{
//		heapdown(hp, i ,total);
//	}
//}
void Topk(int k)
{
	const char* file = "text.txt";
	FILE* fin = fopen(file, "r");
	int* arr = (int*)malloc(sizeof(int) * k);
	if (arr==NULL)
	{
		perror("malloc");
		return;
	}
	for (int i = 0; i < k; i++)
	{
		fscanf(fin, "%d", &arr[i]);
	}
	for (int i = (k - 1 - 1) / 2; i >= 0; i--)
	{
		heapdown(arr, i ,k);
	}
	int x = 0;
	while (fscanf(fin, "%d", &x)>0)
	{
		if (x>arr[0])
		{
			arr[0] = x;
		}
		for (int i = (k - 1 - 1) / 2; i >= 0; i--)
		{
			heapdown(arr, i, k);
		}
	}

	for (int i = 0; i < k; i++)
	{
		printf("%d ", arr[i]);
	}
	fclose(fin);
}
void createdate()
{
	int n = 100000;
	const char* file = "text.txt";
	FILE* fin = fopen(file, "w");
	if (fin == NULL)
	{
		perror("fopen");
		return;
	}
	for (int i = 0; i < n; i++)
	{
		int x = (rand()+i) % 10000000;
		fprintf(fin, "%d\n", x);
	}
	fclose(fin);
}
int main()
{

	srand((unsigned int)time(NULL));
	int num=10;
	scanf("%d", &num);
    //createdate();
	Topk(num);
}