排序--02-数组中的第K个最大元素

本文介绍了如何在未排序的数组中寻找第k个最大的元素,提供三种不同的解决方案:优先队列(小顶堆)、排序和快速选择(partition)。重点讲解了使用优先队列的方法,通过构建大小为k的小顶堆,逐步更新堆来找到第k大的元素。此外,还讨论了在海量数据场景下如何处理此类问题,并提到了位图法用于去重和节省内存。
摘要由CSDN通过智能技术生成

https://leetcode-cn.com/problems/kth-largest-element-in-an-array/

在未排序的数组中找到第 k 个最大的元素。请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。

示例 1:

输入: [3,2,1,5,6,4] 和 k = 2

输出: 5

示例 2:

输入: [3,2,3,1,2,4,5,5,6] 和 k = 4

输出: 4

说明: 你可以假设 k 总是有效的,且 1 ≤ k ≤ 数组的长度。

思路

思路1,构建优先队列(小顶堆)。先将数组添加到k-1个。接着继续添加时,判断,如果新值比堆顶大,就弹出堆顶,放入新元素。扫描到最后时,堆顶就是第k大的元素。

思路2,排序并返回第k大。

思路3,partition。

答案

class Solution {
public:
    int findKthLargest(vector<int>& nums, int k) {
        priority_queue<int,vector<int>,greater<int>> q;
        for (int i = 0; i < nums.size(); i++) {
            if (q.size() < k)  //构建大小为k的小顶堆
                q.push(nums[i]);
            else if (nums[i] > q.top()) {
                q.pop();
                q.push(nums[i]);
            }
        }
        return q.top();
    }
};

topK问题

本部分题目常常是1亿数据中,找出最大的前多少个。本题用堆的思路非常适合。可以将无法装入内存中的数据分开,建立堆,再进行扫描。当然也有一些其他方法。

  1. 最直观的思路:全排序,这几乎不可能。
  2. 如果这1亿个书里面有很多重复的数,先通过Hash法,把这1亿个数字去重复,这样如果重复率很高的话,会减少很大的内存用量,从而缩小运算空间,然后通过分治法或最小堆法查找最大的10000个数。

去重

海量数据中去除相同的重复元素也经常考。一般使用位图法。

举个简单例子,在java中一个int类型的数有32位,而这32只表示一个数太过浪费,于是就考虑让这32位可以表示32个数,每一位表示该数是否存在,例如:

 这里用16位的二进制就能表示十六个数字,1表示存在,0表示不存在,上图就表示存在(16,12,6,4,1)这五个数。上图16bit可以表示1~16是否存在。而假设题目徐兆8位重复电话号码,有:

8位整数可以表示的最大十进制数值为99999999,如果每个数字对应于位图中的一个bit位,那么存储八位整数需要99999999bit大约99Mbit,因为1Byte=8bit,所以99Mbit折合成内存为99/8=12.375MB的内存,及可以只用12.375MB的内存表示所有的8位数电话号码的内容。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值