大数据中的中位数，第K个大的数，前K个大的数

最新推荐文章于 2022-05-09 00:25:37 发布

Maugs_Luyao

最新推荐文章于 2022-05-09 00:25:37 发布

阅读量225

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32069845/article/details/118360292

版权

算法专栏收录该内容

13 篇文章 0 订阅

订阅专栏

直接几亿的数据，限制内存，找出topK的数，或者中位数这类题，目前我的思路有以下几种，总结如下：

1.桶排序：

一、数据量特别大，分布在-2^31-2^31-1 可以制造100W 一个区间的桶，1000个就是10亿，遍历数据也可以每1000W 读取一次，数字在哪个区间，对应区间内的值+1，这样可以迅速找到中位数对应的桶，然后在这个桶中再次寻找中位数。

二、quickSelect思想，和quickSort大体相同，不同的地方是：quickSelect 一次排序后，丢掉无用的另一段，举例：寻找第K大的数，首先取目前数组的中间的数f，以它为基点，比他小的在左边，比他大的在右边，遍历后，判断这个数所在的位置在K之前还是之后，之前就直接从(f,right)寻找第K-f位置的数字即可，在K之后，就遍历(0,f)，寻找第F位置的数字即可。

三、 mapReduce 分治思想。数据均分成N份，每份去进行排序，归纳，最后合并到一起。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据中的中位数，第K个大的数，前K个大的数

直接几亿的数据，限制内存，找出topK的数，或者中位数这类题，目前我的思路有以下几种，总结如下：1.桶排序：1️⃣ 数据量特别大，分布在-2^31-2^31-1 可以制造100W 一个区间的桶，1000个就是10亿，遍历数据也可以每1000W 读取一次，数字在哪个区间，对应区间内的值+1，这样可以迅速找到中位数对应的桶，然后在这个桶中再次寻找中位数。2️⃣quickSelect思想，和quickSort大体相同，不同的地方是：quickSelect 一次排序后，丢掉无用的另一段，举例：寻找第K.
复制链接

扫一扫

专栏目录

Maugs_Luyao CSDN认证博客专家 CSDN认证企业博客

码龄9年

64: 原创

7万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

1451: 积分

103: 粉丝

110: 获赞

11: 评论

177: 收藏

私信

关注

热门文章

分类专栏

jvm 1篇
javaweb 8篇
jquery 1篇
js 2篇
css
oracle 1篇
mysql 3篇
xml
maven
svn
html5 1篇
网络
数据
java 13篇
linux 5篇
github 1篇
spring
spring mvc
struts2 1篇
hibernate
mybatis
dubbo
redis
zookepper
freemarker 2篇
java并发 2篇
算法 13篇
hessian 1篇

最新评论

超时控制这样才放心
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
java位运算及实例和原码.反码，补码的介绍
CSDN-Ada助手: Java 中的反射机制是怎样的？它如何应用于实际开发中？
详细分析置换算法
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.csdn.net/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
二叉树的多种遍历及dfs,bfs思考
旺仔OO糖: 原创不易，博主加油,期待大佬回访！
KMP算法之我思
旺仔OO糖: 放弃不难，但坚持一定很酷,加油，奥里给！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。