2024年最新堆的应用--------Top-k问题(详解)_谁是top k,字节跳动C C++岗面试题

img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上C C++开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以戳这里获取

文章目录

1.什么是Top-k问题

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

2.思路1—排序

这个方法很容易想到,用我们的堆排序解决的话,时间复杂度是O(nlogn).

void Swap(HPDataType\* p1, HPDataType\* p2)
{
	HPDataType tmp;
	tmp = \*p1;
	\*p1 = \*p2;
	\*p2 = tmp;
}
//向下调整
void ADjustDown(HPDataType\* data, HPDataType father,int size)
{
	//法一:迭代
	//HPDataType child = father \* 2 + 1;
	// //if ((data[child] < data[child + 1])&&(child+1<size))//找到孩子较大的一个
	//if ((data[child] > data[child + 1]) && (child + 1 < size))//小堆,找到孩子较小的一个

	//{
	// child++;
	//}
	//while (child<size) 
	//{
	// if (data[father] < data[child])//大堆
	// //if (data[father] > data[child])//小堆
	// 
	// {
	// Swap(&data[father], &data[child]);
	// father = child;//孩子变父亲,向下迭代
	// child = father \* 2 + 1;
	// }
	// else
	// {
	// break;
	// }
	//}
	//法二:递归
	HPDataType child = father \* 2 + 1;
	if (child >= size)return;
	else
	{
		//if ((data[child] < data[child + 1]) && (child + 1 < size))//大堆,找到孩子较大的一个
		if ((data[child] > data[child + 1]) && (child + 1 < size))//小堆,找到孩子较小的一个

		{
		child++;
		}
		//if (data[father] < data[child])//大堆
		if (data[father] > data[child])//小堆
		{
		Swap(&data[father], &data[child]);
		}
		ADjustDown(data,child,size);
	}
}	
void Heapsort(HPDataType\* data,int size)
{
	for (int i = (size - 1 - 1) / 2; i >= 0; i--)
	{
		ADjustDown(data,i,size);
	}
	int end = size - 1;
	while (end > 0)
	{
		Swap(&data[0], &data[end]);
		ADjustDown(data, 0, end);
		end--;
	}
}

3.思路2—建堆,Top/Pop k次

也就是说我们先建一个大堆(时间复杂度O(logn)),然后取出堆顶的元素,再删除,重复k次

for (int i = (size - 1 - 1) / 2; i >= 0; i--)
	{
		ADjustDown(data,i,size);
	}
	for(int i=0;i<k;i++)
	{
	printf("%d ",HeapTop(data);
	HeapPop(data);
	}

4.思路3—建一个大小为k的小堆(最优解)

因为上述两种方法都是在内存中执行的,但是当我们 n很大时,占用内存很大,比如说n为100亿,
我们知道1G=1024MB=1024 * 1024KB==1024 * 1024 * 1024Byte约等于10亿Byte左右,就算有 那么大的内存,那么成本也很高!!!

所以我们采用建一个大小为k的小堆,为什么是小堆呢,我们知道小堆是用来排升序的,当我们向后遍历数据和堆顶比较,如果比堆顶大就替换,然后在向下调整,这样就大大减小内存的使用!!
但是用人会问,哪里一开始那个数据是n个那不也很大吗??对于这个问题的解释就是数据不一定是来自内存,可能来自硬盘,数据库,网络上的,而上述两种方法都是得存在内存上的,或者我们使用归并排序,但是数据不在内存上,归并排序效率会降低!!

代码:

//向下调整
void ADjustDown(HPDataType\* data, HPDataType father,int size)
{
	//法一:迭代
	//HPDataType child = father \* 2 + 1;


![img](https://img-blog.csdnimg.cn/img_convert/c0fb591c25639a93d875d22edb6470d8.png)
![img](https://img-blog.csdnimg.cn/img_convert/7baed60be3881dc0d3327ed550af4f8f.png)

**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化的资料的朋友,可以添加戳这里获取](https://bbs.csdn.net/topics/618668825)**


**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

份系统化的资料的朋友,可以添加戳这里获取](https://bbs.csdn.net/topics/618668825)**


**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值