从10亿个数中找出前100个最大的

安静读书

已于 2022-03-01 11:24:42 修改

阅读量1.2k

点赞数 2

分类专栏：排序算法算法面试文章标签：算法排序算法

于 2020-11-18 09:35:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42267411/article/details/109764237

版权

排序算法同时被 3 个专栏收录

3 篇文章

订阅专栏

3 篇文章

订阅专栏

1 篇文章

订阅专栏

谈从10亿个数中找出前100个最大的（阿里java二面）

单位关系：

基本数据类型占用字节数：

数据类型	关键字	内置类	内存占用字节数	可存储的取值范围	默认值
布尔型	boolean	Boolean	1字节	true，false	false
字符型	char	Character	2字节	16位Unicode字符，可容纳各国字符集。Unicode范围为‘\u0000’到‘ufff’。整数范围是0~65535。例如，65代表‘A’，97代表‘a’	‘\u0000’ Null
字节型	byte	Byte	1字节	-128~127 （-27~27-1）	0
短整型	short	Short	2字节	-32768~32767 （-215~215-1）	0
整形	int	Integer	4字节	-231~231-1	0
长整型	long	Long	8字节	-263~263-1	0
单精度型	float	Float	4字节		0.0F
双精度型	double	Double	8字节		0.0D

一个单精度浮点数占用4字节，10亿个浮点数是40亿字节，对应G与字节转换为2^30/1，所以10亿个浮点数大概占据3G左右的空间，因此全部一次性读入内存目前在个人PC上是不太现实的。本次讨论不考虑内存等等，只考虑算法。

如果一次性比较排序，然后输出前面最大的100个，那么众所周知，算法的时间复杂度不下于O(N logN)，此处的N为数的个数（10亿）。

如果用堆排序，由于堆排序像合并排序而不像插入排序，堆排序的运行时间为O(N logN);又像插入排序而不像合并排序，堆排序是一种原地排序。因此堆排序具有相对小的运行时间和占用相对小的额外空间的优点。

再则，利用最小堆的性质，堆顶元素是整棵树中具有最小值的元素，因此，我们可以构建这样的一个最小堆：

step1：取前m个元素（例如m=100），建立一个小顶堆

保持一个小顶堆得性质的步骤，运行时间为O（logm);

建立一个小顶堆运行时间为m*O（logm）=O(m logm);

其实建立一个小顶堆实际运行时间为O(m);具体分析参考算法导论。

step2:顺序读取后续元素，直到结束

每次读取一个元素，如果该元素比堆顶元素小，直接丢弃

如果大于堆顶元素，则用该元素替换堆顶元素，然后保持最小堆性质

最坏情况是每次都需要替换掉堆顶的最小元素，因此需要维护堆的代价为(N-m)*O(logm);

最后这个堆中的元素就是前最大的100个。

时间复杂度为O(10亿 log100)，即时间复杂度为O(N logm）。

博客等级

码龄7年

50
原创

386
点赞

386
收藏

379
粉丝

关注

私信

热门文章

分类专栏

ffmpeg 2篇
数据库 3篇
面试 1篇
排序算法 3篇
算法 3篇
RockerMQ 1篇
IDEA 2篇
记录 1篇
前端 1篇
后端 13篇
工具类方法 6篇
JVM 1篇

展开全部收起

上一篇：: 冒泡排序算法-思想+Java实现

下一篇：: RockerMQ，push消费

最新评论

详细介绍MySQL、Mongo、Redis等数据库的索引
征途黯然.: “深入浅出解析MySQL、MongoDB与Redis索引机制，展现数据库索引技术的多样性与高效性，是提升数据库性能的不可或缺之选。”
深入理解 Kafka：分布式消息队列的强大力量
王嘉尔(^^): 在现代分布式系统中，消息队列扮演着至关重要的角色，而 Kafka 作为其中的佼佼者，以其高吞吐量、可扩展性和持久性等特点被广泛应用。无论是处理海量的日志数据、实时的用户交互信息，还是复杂的微服务间通信，Kafka 都展现出了卓越的性能。
深入理解 Kafka：分布式消息队列的强大力量
张建豫: Kafka 作为一款强大的分布式消息队列系统，在现代分布式应用中有着广泛的应用。通过了解其架构、工作流程以及优势，我们可以更好地利用它来构建高效、可靠的消息处理系统，满足不同业务场景下的需求，无论是大数据处理、实时流处理还是微服务架构中的通信等领域，Kafka 都将继续发挥重要的作
Map排序，按key排序，按value排序，jdk8，lamda。
安静读书: 安装python环境，使用pycharm就可以了
Map排序，按key排序，按value排序，jdk8，lamda。
CSDN-Ada助手: 如何在Windows平台下使用Python进行开发？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。