处理TopK问题的两种方式

TopK问题:即给定n个数据,从中找出Topk大的数据或者TopK小的数据

       在处理海量数据的时候,往往需要找出Top前几的数据,这时候,如果直接对数据进行排序,在处理海量数据的时候往往就是不可行了,而且排序最好的时间复杂度是nlogn,当n远大于需要获取到的数据的时候,时间复杂度就显得过高;

一、使用最大堆或者最小堆可以很好的解决Top大问题或者Top小问题

解决Top大问题,也就是找出前k大的数据,那么我们使用小堆【为什么是使用小堆?因为小堆的堆顶元素是最小的,如果比最小的还小,那么一定不在topK里面,如果比最小的小,就要先加进来,然后再向下调整,保持堆顶元素的最小;如果是大堆的话,那么第一个元素是最大的,和堆顶元素去比较,就可能会让一些比堆顶元素小,但是比下面元素大的元素进不去堆中,也就不是最后我们要得到的topK了,不合理,所以TopK大选用小根堆】

         思路如下:1、先建立一个固定k大小的小根堆,已放入k个数据,然后向堆中继续添加元素

                          2、如果当前元素大于堆顶元素,则替换堆顶元素为当前元素,然后向下调整为大根堆;若小于,则不替换,数据向后移动

                          3、重复第二步,直到数据全部遍历结束

        对于n个数,取Top m

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值