大量数据中选择top-K有序数据归总分析

最新推荐文章于 2020-12-17 10:12:01 发布

dydm_13128

最新推荐文章于 2020-12-17 10:12:01 发布

阅读量770

点赞数

文章标签：数据大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dydm_13128/article/details/20381953

版权

如题，是在面试中常会碰到的问题，根据个人阅历以及网上相关资料，进行总结如下，必有不全，若有好方法，敬请回复，若有错误之处，敬请指正。

数据量设为n。

1. 此法是我很久之前看到过的一种，通过建立一个长度为K的有序数组(或者链表)，保证该数组中数据为当前扫描数据量的top-K，依次扫描完毕，自然在空间复杂度为K的前提下完成了排序，不过时间复杂度不低，得要K*(K-1)/2 * n。若有异议，请指出，本人对于复杂度的计算一直觉得很头疼。所以，接下来的方法中，可能有复杂度并未分析，望牛人回复并分析之，成分感谢；

2. 分块进行冒泡排序，即每块都冒K个泡，然后对各块冒泡结果进行一次冒泡；

3. 对于方案1的一个改进吧，使用堆数据结构，将top-K用堆保存，每次比较堆顶值，出现交换之后维护堆需要O(logK)，则时间复杂度为n*logK.

4. 由于分布式处理，以及大数据的出现，也出现了用maprecduce解决该题的方案，不过目前并未深入研究，暂不写之。

第一遍博文，内容可能过于简洁了，慢慢改进吧。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。