刷题 | top k问题

tuuzkiii_Tuu

已于 2022-03-14 12:09:28 修改

阅读量2k

点赞数

分类专栏：刷题文章标签： topk

于 2022-03-09 20:51:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42278275/article/details/123387101

版权

刷题专栏收录该内容

20 篇文章 0 订阅

订阅专栏

包含排序

sort--排全部

冒泡等--排k个 n*k

快排--nlogn的复杂度，但是是在平均的情况下，最糟糕的情况依然是n方

不含排序

随机选择--用快排的思想，但只递归一边是On（哼哼，某厂面试官还...）

堆--以最小k个为例，先把前k个元素建立一个大顶堆（On），然后从k+1开始遍历，如果小于堆顶则替换，并下沉，最糟糕的复杂度是nlogk

大数据的情况 100亿找1000

堆ok

mapreduce

1.将100亿个数据分为1000个大分区，每个区1000万个数据
2.每个大分区再细分成100个小分区。总共就有1000*100=10万个分区
3.计算每个小分区上最大的1000个数
4.合并每个大分区的100个小分区，得到1000个大分区，找出每个大分区的前1000个数。
5.合并大分区，得到总的区，找出前1000

hash（如果重复度很高）

1. 去重（附常识 | hashset去重_tuuzkiii_Tuu的博客-CSDN博客
2. 用堆

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。