一亿数据获取最大值的前100位

最新推荐文章于 2021-12-08 21:24:53 发布

xiaocg2009

最新推荐文章于 2021-12-08 21:24:53 发布

阅读量2.8k

点赞数

分类专栏： algorithms

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35057840/article/details/52425623

版权

algorithms 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

两种思路：

1. 根据快速排序划分的思想

a. 假设数组为 array[N] (N = 1 亿)，首先利用quicksort的原理把array分成两个部分，左边部分比 array[N - 1] (array中的最后一个值，即pivot) 大，右边部分比pivot 小。然后，可以得到 array[array.length - 1] (即 pivot) 在整个数组中的位置，假设是 k.
b. 如果 k 比 99 大，我们在数组[0, k - 1]里找前 100 最大值。（继续递归）
c. 如果 k 比 99 小，我们在数组[k + 1, ..., N ]里找前 100 - (k + 1) 最大值。（继续递归）
d. 如果 k == 99, 那么数组的前 100 个值一定是最大的。（退出）

2.先取出前100个数，维护一个100个数的最小堆，遍历一遍剩余的元素，在此过程中维护堆就可以了。具体步骤如下：
step1：取前m个元素（例如m=100），建立一个小顶堆。保持一个小顶堆得性质的步骤，运行时间为O（lgm);建立一个小顶堆运行时间为m*O（lgm）=O(m lgm);
step2:顺序读取后续元素，直到结束。每次读取一个元素，如果该元素比堆顶元素小，直接丢弃
如果大于堆顶元素，则用该元素替换堆顶元素，然后保持最小堆性质。最坏情况是每次都需要替换掉堆顶的最小元素，因此需要维护堆的代价为(N-m)*O(lgm);

最后这个堆中的元素就是前最大的10W个。时间复杂度为O(N lgm）。

两种思路比较：

基于最小堆方法运行时间很稳定（每次运行时间相差很小），基于quicksort原理的方法运行时间不稳定（每次运行时间相差大）。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
一亿数据获取最大值的前100位

两种思路：1. 根据快速排序划分的思想 a. 假设数组为 array[N] (N = 1 亿)，首先利用quicksort的原理把array分成两个部分，左边部分比 array[N - 1] (array中的最后一个值，即pivot) 大，右边部分比pivot 小。然后，可以得到 array[array.length - 1] (即 pivot) 在整个数组中的位置，假设是 k.
复制链接

扫一扫

专栏目录

xiaocg2009 CSDN认证博客专家 CSDN认证企业博客

码龄8年

35: 原创

25万+: 周排名

93万+: 总排名

7万+: 访问

: 等级

1028: 积分

19: 粉丝

43: 获赞

6: 评论

154: 收藏

私信

关注

热门文章

分类专栏

methods 3篇
C/C++ 10篇
数据库 3篇
面试 6篇
Linux 3篇
windows 1篇
Qt 4篇
MFC
algorithms 1篇
tools 2篇

最新评论

C语言浮点数存储方式
uismile: 8.25 的二进制表示 1000.01
qt打包程序
shmiloveyou: 打出来的包，安装引导界面惨不忍睹
qt之读写excel
shmiloveyou: [code=cpp] QAxObject其实就是封装了ActiveX（Excel有以OLE方式提供外部接口，而且OLE是ActiveX的前身）使用接口，使用ActiveX控件需要了解以下几个知识点： 1、CreateObject函数中的参数的含义 CreateObject作用是创建对象实例，参数就是对象的“名字”，Windows组件对象有两个名字，一个是PROGID，一个是CLSID，那么，我们怎么知道它的名字是什么呢 2、CLSID 以WPS表格为例，打开控制面板-管理工具-组件服务-计算机-我的电脑-DCOM配置，右键点击“WPS Spreadsheets Application Class”，点属性，就可看到CLSID{45540001-5750-5300-4B49-4E47534F4655} 3、PROGID 打开注册表编辑器，定位到我的电脑\HKEY_CLASSES_ROOT\CLSID\{45540001-5750-5300-4B49-4E47534F4655}\PROGID，可看到KET.Application.9，如此就找到这个组件的名字了。 [/code]
qt之读写excel
shmiloveyou: 用户所用WPS升级至2013版后(以及高于WPS2013版), WPS表格程序的PROGID从“ET.Application”改为“KET.Application”。Microsoft Office Excel的PROGID为“Excel.application”。
qt之读写excel
shmiloveyou: [code=cpp] ExcelOperator::ExcelOperator() { mpExcel = nullptr; HRESULT r = ::OleInitialize(0); if (r != S_OK && r != S_FALSE) { qDebug("Qt: Could not initialize OLE (error %x)", (unsigned int)r); } Initialize(); } ExcelOperator::~ExcelOperator() { if (mpExcel) { mpExcel->dynamicCall("Quit()"); delete mpExcel; mpExcel = nullptr; } ::OleUninitialize(); } void ExcelOperator::Initialize() { QStringList excelApps; excelApps << "et.application" << "ket.application" << "excel.application"; for (const auto& excelAppName : excelApps) { CLSID clsid; if (SUCCEEDED(CLSIDFromProgID(LPCOLESTR(excelAppName.utf16()), &clsid))) { mbIsValid = true; mpExcel = new QAxObject(excelAppName); break; } } } [/code]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。