查找最小的k 个元素

 5.查找最小的k 个元素
题目:输入n 个整数,输出其中最小的k 个。
例如输入1,2,3,4,5,6,7 和8 这8 个数字,则最小的4 个数字为1,2,3 和4。
(参考《编程之美》)
看完题目自己的思路:
    1.要找到最小的k个元素,需要先排序再选择k个最小值。但是时间复杂度至少O(nlog)了
    2.如果用选择排序或交换排序,执行k步,那么时间复杂度为O(k*n),而且需要多次读
看过资料后有下面几种思路:
    1.快速排序,随机找一个元素,一次排序后判断分割成左右两边的l,r  若l.length<k则,l部分均属于最小的k个元素,加入result中,继续在r继续快排,找最小的k-l.lenght个元素即可。 若l.length==k,则可返回result了
      时间复杂度O(n*logk)
    2.当n较大,如100亿时,不能一次性读入内存,所以要求尽可能少的遍历所有数据。
      初始化一个大小为k的数组,并记录当前数组的最大值max,依次读入n个数字,若比max大,continue;若比max小,则插入到数组中,并更新当前的最大值。
       时间复杂度为O(k*n)  但是相比于自己的思路1,减少了遍历n的次数。
    3. 利用hash保存数组中元素Si出现的次数,利用计数排序的思想,线性从大到小扫描过程中,前面有k-1个数则为第k大数,平均情况下时间复杂度O(n)
    4.还有更好的思路吗-----利用堆排序?
      利用堆排序,建立一个大小为k的大顶堆,遍历n个数字,若比堆顶元素小,则取代之,并将堆更新保持大顶堆。  那么只需要遍历一次n,然后输出大小为k的最终的大顶堆。 即为最小的k个数字。O(nlogk)  
      思考:当k也非常大,大小为k的大顶堆无法一次存在内存该如何呢?
      可以先找最小的m(假设内存可存入m大小的堆),得到stack1,然后再建大小为m的堆,找最小的m+1~2*m的数字。遍历n,若比堆顶元素小,并且大于stack1的最大值,则入堆。
      从而可以得出最小的k个数

     具体的选择还是得考虑n,k的大小

思考题:如果是找k到m(o<k<=m<=n)大的数呢?
my answer:利用大顶堆,大小为m的,先找m大的,再在m个数中找前k
          数字比较集中的话,可以用上面的方法3

扩展学习:搜索引擎的排序算法。待学习
                  
     
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值